µn¤J
¡U
µù¥U
¡U
·|û¤¤¤ß
¡U
µ²±b
¡U
°ö°V½Òµ{
Å]ªk§Ì¤l
¡U
¦Û¸ê¥Xª©
¡U
¹q¤l®Ñ
¡U
«ÈªA¤¤¤ß
¡U
´¼¼z«¬¥ßÊ^·|û
®Ñ¦W
¥Xª©ªÀ
§@ªÌ
isbn
½s¸¹
5050Å]ªk²³Äw
|
NG®Ñ«°
|
°ê»Ú¯Å«~µP½Òµ{
|
Àu´f³qª¾
|
ÅRÆE^¶¯µ¼Öºë¿ï
|
¸ê®Æ±´°É²z½×»PÀ³¥Î**¡G¥HIBM SPSS Modeler¬°½d¨Ò(ªþCD)
¦¹§@ªÌµL¬ÛÃö®ÑÄy
¤å¾Ç¤p»¡
¤å¾Ç
¡U
¤p»¡
°ÓºÞ³Ð§ë
°]¸g§ë¸ê
¡U
¦æ¾P¥øºÞ
¤H¤åÃÀ§{
©v±Ð¡Bõ¾Ç
ªÀ·|¡B¤H¤å¡B¥v¦a
ÃÀ³N¡B¬ü¾Ç
¡U
¹q¼vÀ¸¼@
Ày§Ó¾i¥Í
ÂåÀø¡B«O°·
®Æ²z¡B¥Í¬¡¦Ê¬ì
±Ð¨|¡B¤ß²z¡BÀy§Ó
¶i׾Dzß
¹q¸£»Pºô¸ô
¡U
»y¨¥¤u¨ã
Âø»x¡B´Á¥Z
¡U
x¬F¡Bªk«ß
°Ñ¦Ò¡B¦Ò¸Õ¡B±Ð¬ì¥Î®Ñ
¬ì¾Ç¤uµ{
¬ì¾Ç¡B¦ÛµM
¡U
¤u·~¡B¤uµ{
®a®x¿Ë¤l
®a®x¡B¿Ë¤l¡B¤H»Ú
«C¤Ö¦~¡Bµ£®Ñ
ª±¼Ö¤Ñ¦a
®È¹C¡B¦a¹Ï
¡U
¥ð¶¢®T¼Ö
º©µe¡B´¡¹Ï
¡U
¨î¯Å
Reinforcement Learning¤¤¤åª©¡G±j¤Æ¾Ç²ß²`«×¸ÑªR
§@ªÌ¡G
Richard S. Sutton, Andrew G. Barto
ĶªÌ¡G
³\士文¡B卓信宏
¤ÀÃþ¡G
¹q¸£»Pºô¸ô
¡þ
¸ê®Æ®w
¥Xª©ªÀ¡G
ùÖ®p
¥Xª©¤é´Á¡G2021/4/27
ISBN¡G9789865027193
®ÑÄy½s¸¹¡Gkk0531276
¶¼Æ¡G592
©w»ù¡G
1200
¤¸
Àu´f»ù¡G
82
§é
984
¤¸
®Ñ»ùY¦³²§°Ê¡A¥H¥Xª©ªÀ¹ê»Ú©w»ù¬°·Ç
qÁÊ«á¥ß§Y¬°±z¶i³f
qÁÊ«á¥ß§Y¬°±z¶i³f¡G¥Ø«eµL®w¦s¶q,ŪªÌ¤Uq«á,¶}©l¶i¤J½Õ®Ñµ{§Ç,¤@¯ë¤Ñ¼Æ¬ù¬°2-10¤u§@¤é(¤£§t¨Ò°²¤é)¡C
¹ÎÁʼƳ̧C¬° 20 ¥»¥H¤W
µû»ù¼Æ¡G
(½Ð±N·Æ¹«²¾¦Ü¬P¬P³B¶i¦æµû»ù)
¥Ø«e¥§¡µû»ù¡G
¤å¦r³sµ²
½Æ»s»yªk
Reinforcement Learning¤¤¤åª©¡G±j¤Æ¾Ç²ß²`«×¸ÑªR
¹Ï¤ù³sµ²
½Æ»s»yªk
¤À
¨É
¤º®e²¤¶
®ÑÄy¥Ø¿ý
¦PÃþ±ÀÂË
Reinforcement Learning中文版¡G強化學習深度¸Ñ析 內容簡介 °w對強化學習的ÃöÁä概念和演算法¡A提供清晰¦Ó簡單的»¡明 什»ò是強化學習 強化學習是學習¸Ó做什»ò¡]如何將當前情形映射到動作上¡^¡A以便最大化一個獎勵°T¸¹數值¡C學習ªÌ不會³Q告知n採取哪些動作¡A¦Ó是必¶·³z¹L嘗¸Õ來發現哪些動作會產生最大的回報¡C在最有½ì和最具挑戰性的案例中¡A動作不僅會影ÅT當下的獎勵¡A同時也會影ÅT下一個情境¡A並且影ÅT後續所有的獎勵¡C¸Õ»~搜尋和延¿ð獎勵³o兩個特性¡A是強化學習中的兩個最«n的區別特徵¡C 本書精ªö內容包括¡G ¡D涵»\所有強化學習演算法的核心概念 ¡D¸Ñ決有°¨可夫決策問ÃD的三種基本方法 ¡Dªñ似最佳策略¶i¦æ控制的方式 ¡D介紹並分析¸ê格痕¸ñ演算法的機制 ¡D強化學習»P心理學和神經科學之¶¡的Ãö係 ¡D強化學習的相Ãö應用»P未來強化學習研究中一些正在¶i¦æ的前瞻技³N 專家推ÂË "³o本書是強化學習的¸t經¡AŲ於¸Ó»â域的½´勃發展¡A新版特別及時¡C不管是學生¡B研究人員¡B從業人是¡A只n對強化學習感¿³½ì的人¡A³£應¸Ó收ÂÃ一本¡C" -Pedro Domingos, µØ盛¹y大學教授¡B¡m大演算¡n作ªÌ "所有研究強化學習的學ªÌ¡A³£曾受到本書第一版的啟發¡A第二版保ÃÒÅý大家更滿意¡C新版的內容大幅增加¡A新版涵»\的內容更深更廣¡A¦Ó且依然保留¸Ñ»¡簡單直接的特¦â¡C" -Csaba Szepesvari, ªü爾伯塔大學教授¡BDeepMind研究科學家 "我推Â˳o本書給所有想n»{ÃÑ機器學習的人¡C第二版涵»\了當今最ÃöÁä的演算法»P理½×¡A以實»Ú的應用來¸Ñ»¡概念¡A範圍從控制機器人到如何打敗世界³»尖的棋手¡A並從心理學»P神經科學的¨¤度探°Q演算法»P人Ãþ學習之¶¡的基本Ãö³s¡C" -Tom Mitchell, 卡內基梅¶©大學教授 "強化學習»â域的經典之作¡A強化學習是現代人工智慧的發展基礎¡C³o是一本想n»{真研究AI科技的人必Ū的書¡C" - Demis Hassabis, DeepMindÁp合創始人兼CEO "第二版的問世恰³{其時¡A如果您想了¸Ñ強化學習³o個»â域¡A本書是最好的°_ÂI¡C我ªÖ定會將³o本書推ÂË給我的學生以及其他想n了¸Ñ強化學習的研究人員" -- Yoshua Bengio, ¡m深度學習¡n作ªÌ¡B»X特婁大學教授
¥Ø¿ý ²Ä¤Gª©«e¨¥ ²Ä¤@ª©«e¨¥ ²Å¸¹ºKn ²Ä1³¹ ¾É½× Part I ªí®æ¦¡¸Ñ¨M¤èªk ²Ä2³¹ ¦h·nÁu¦¡©ÔÅQ¾÷ ²Ä3³¹ ¦³°¨¥i¤Ò¨Mµ¦¹Lµ{ ²Ä4³¹ °ÊºA³W¹º ²Ä5³¹ »X¦a¥dù¤èªk ²Ä6³¹ ®É§Ç®t¤À¾Ç²ß ²Ä7³¹ n ¨B¦Û§Uªk ²Ä8³¹ ªí®æ¦¡¤èªkªº³W¹º©M¾Ç²ß Part II ªñ¦ü¸Ñ¨M¤èªk ²Ä9³¹ on-policy ¹w´úªºªñ¦ü¤èªk ²Ä10³¹ on-policy ±±¨îªºªñ¦ü¤èªk ²Ä11³¹ *off-policy ªºªñ¦ü¤èªk ²Ä12³¹ ¸ê®æ²ª¸ñ ²Ä13³¹ µ¦²¤±è«×¤èªk Part III ²`¤JÆ[¹î ²Ä14³¹ ¤ß²z¾Ç ²Ä15³¹ ¯«¸g¬ì¾Ç ²Ä16³¹ À³¥Î©M®×¨Ò¬ã¨s ²Ä17³¹ «e¤§Þ³N °Ñ¦Ò¸ê®Æ»P¤åÄm
¸ê®Æ¬ì¾Ç¾Ç²ß¤â¥U¡UP
Statistica
Neo4j§Þ³N¤â¥U¡U
Excel ¡Ñ Ta
±q¸Õºâªí¨ì¸ê®Æ¥¥x¡G
§Aªº²Ä¤@¥»Git»PG
°Ó¥Î¤j¼Æ¾Ú¤ÀªR(²Ä¤G
Notion X A
dbt »P Anal
7¤Ñ¾Ç·|¤j¼Æ¾Ú¸ê®Æ³B
¬°¤F«O»Ù±zªºÅv¯q¡A·sµ·¸ôºô¸ô®Ñ©±©ÒÁʶRªº°Ó«~§¡¨É¦³¨ì³f¤C¤ÑªºÅ²½à´Á¡]§t¨Ò°²¤é¡^¡C°h¦^¤§°Ó«~¥²¶·©óŲ½à´Á¤º±H¦^¡]¥H¶lÂW©Î¦¬°õÁp¬°¾Ì¡^¡A¥B°Ó«~¥²¶·¬O¥þ·sª¬ºA»P§¹¾ã¥]¸Ë(°Ó«~¡Bªþ¥ó¡B¤º¥~¥]¸Ë¡BÀH³f¤å¥ó¡BÃØ«~µ¥)¡A§_«h®¤¤£±µ¨ü°h³f¡C