µn¤J
¡U
µù¥U
¡U
·|û¤¤¤ß
¡U
µ²±b
¡U
°ö°V½Òµ{
Å]ªk§Ì¤l
¡U
¦Û¸ê¥Xª©
¡U
¹q¤l®Ñ
¡U
«ÈªA¤¤¤ß
¡U
´¼¼z«¬¥ßÊ^·|û
®Ñ¦W
¥Xª©ªÀ
§@ªÌ
isbn
½s¸¹
5050Å]ªk²³Äw
|
NG®Ñ«°
|
°ê»Ú¯Å«~µP½Òµ{
|
Àu´f³qª¾
|
ÅRÆE^¶¯µ¼Öºë¿ï
|
89S51/52 ³æ´¹¤ù»P±MÃD»s§@³Ì¨Î½d¥»¡G¨Ï¥ÎKeil(ªþ½d¨Òµ{¦¡ÀɮפÎKeil C³nÅé)
¦¹§@ªÌµL¬ÛÃö®ÑÄy
¤å¾Ç¤p»¡
¤å¾Ç
¡U
¤p»¡
°ÓºÞ³Ð§ë
°]¸g§ë¸ê
¡U
¦æ¾P¥øºÞ
¤H¤åÃÀ§{
©v±Ð¡Bõ¾Ç
ªÀ·|¡B¤H¤å¡B¥v¦a
ÃÀ³N¡B¬ü¾Ç
¡U
¹q¼vÀ¸¼@
Ày§Ó¾i¥Í
ÂåÀø¡B«O°·
®Æ²z¡B¥Í¬¡¦Ê¬ì
±Ð¨|¡B¤ß²z¡BÀy§Ó
¶i׾Dzß
¹q¸£»Pºô¸ô
¡U
»y¨¥¤u¨ã
Âø»x¡B´Á¥Z
¡U
x¬F¡Bªk«ß
°Ñ¦Ò¡B¦Ò¸Õ¡B±Ð¬ì¥Î®Ñ
¬ì¾Ç¤uµ{
¬ì¾Ç¡B¦ÛµM
¡U
¤u·~¡B¤uµ{
®a®x¿Ë¤l
®a®x¡B¿Ë¤l¡B¤H»Ú
«C¤Ö¦~¡Bµ£®Ñ
ª±¼Ö¤Ñ¦a
®È¹C¡B¦a¹Ï
¡U
¥ð¶¢®T¼Ö
º©µe¡B´¡¹Ï
¡U
¨î¯Å
±j¤Æ¾Ç²ß¾É½×
§@ªÌ¡G
ªô偉¨|
¤ÀÃþ¡G
¤u·~¡E¤uµ{
¡þ
¹q¤l¡E¹q¾÷
ÂO®Ñ¨t¦C¡G¹ê¥Î¹q¤l
¥Xª©ªÀ¡G
¥þµØ¹Ï®Ñ
¥Xª©¤é´Á¡G2021/11/22
ISBN¡G9789865038717
®ÑÄy½s¸¹¡Gkk0546606
¶¼Æ¡G232
©w»ù¡G
400
¤¸
Àu´f»ù¡G
88
§é
352
¤¸
®Ñ»ùY¦³²§°Ê¡A¥H¥Xª©ªÀ¹ê»Ú©w»ù¬°·Ç
qÁÊ«á¥ß§Y¬°±z¶i³f
qÁÊ«á¥ß§Y¬°±z¶i³f¡G¥Ø«eµL®w¦s¶q,ŪªÌ¤Uq«á,¶}©l¶i¤J½Õ®Ñµ{§Ç,¤@¯ë¤Ñ¼Æ¬ù¬°2-10¤u§@¤é(¤£§t¨Ò°²¤é)¡C
¹ÎÁʼƳ̧C¬° 20 ¥»¥H¤W
µû»ù¼Æ¡G
(½Ð±N·Æ¹«²¾¦Ü¬P¬P³B¶i¦æµû»ù)
¥Ø«e¥§¡µû»ù¡G
¤å¦r³sµ²
½Æ»s»yªk
±j¤Æ¾Ç²ß¾É½×
¹Ï¤ù³sµ²
½Æ»s»yªk
¤À
¨É
¤º®e²¤¶
®ÑÄy¥Ø¿ý
¦PÃþ±ÀÂË
強化學習導½× 內容簡介 ªñ年來因人工智慧¿³°_¡A帶°_³\多學生¡B工程師»P學ªÌ¶}始投入相Ãö技³N的學習¡B研究和¶}發¡C早期½Í到人工智慧¡A大³¡分會Áp想到機器學習中的監督式學習和«D監督式學習¡C然¦Ó監督或«D監督式學習¸ûÃø³B理動態系統¡A機器學習技³N的另一個分支─強化學習¡A剛好¸É¨¬此缺口¡C強化學習的應用相當廣¡A最有名的兩個例子為AlphaGo³z¹L¸ê料學習在圍棋比ÁÉ上屢獲佳績¡A以及Google利用強化學習技³N¡A優化¸ê料中心的¹B作¡A¶i¦Ó減少40%的冷卻ªá¶O¡C本書以奠定基本功為目的¡A一步步帶»âŪªÌ建構完整的強化學習知ÃÑ¡A介紹的相Ãö概念包含¡G動態³W劃¡B»X地卡羅法¡B1步時¶¡差分法¡Bn步時¶¡差分法¡Bªñ似¸Ñ法¡B³W劃»P學習¡B¸ê格¸ñ»P學習¡B策略梯度法¡C 本書特¦â 1.本書從假³]»P理½×¶}始°Q½×¡A再¶i入演算法»P範例¡AÅýŪªÌ了¸Ñ整Åé架構的來Às去¯ß¡C 2.每章的¶}始先綜z¸Ó章的主n內容¡AÅýŪªÌ有大方向的了¸Ñ¡A再¶i入細節的°Q½×¡C 3.相Ãö概念以圖示方式呈現¡AŪªÌ¸û易理¸Ñ»P統整¡C 4.每章搭°t範例»P程式碼¡A徹底了¸Ñ演算法特性¡C 5.每章結尾作«ÂI回ÅU¡A條列¸Ó章¸Ì«n概念¡A方便ŪªÌ確»{學習«ÂI¡C 6.本書¾A用於¦Û學¡B大學或科大½Ò程教科書»P實作專ÃD的»²助教材¡A以及業界工程師快³t奠定強化學習基礎概念»P實作¯à力的教學書籍¡C
¥Ø¿ý ²Ä1³¹ ±j¤Æ¾Ç²ß®Ø¬[ 1-1 ±j¤Æ¾Ç²ß¥Dn¤¸¯À»P°¨¥i¤Ò¨Mµ¦¹Lµ{ 1-2 ½d¨Ò1.1 1-3 µ¦²¤©M»ùÈ¨ç¼Æ 1-4 ½d¨Ò1.2 1-5 ³Ì¨Îµ¦²¤©M³Ì¨Î»ùÈ¨ç¼Æ «ÂI¦^ÅU ³¹¥½½m²ß ²Ä2³¹ °ÊºA³W¹º 2-1 µ¦²¤µû¦ô 2-2 µ¦²¤§ï¶i 2-3 ½d¨Ò2.1»Pµ{¦¡½X 2-4 µ¦²¤Å|¥N©M»ùÈÅ|¥N 2-5 °ÊºA³W¹ºªºÀu¯ÊÂI»P²§¨B§ó·s 2-6 ½d¨Ò2.2»Pµ{¦¡½X 2-7 ¼s¸qµ¦²¤Å|¥N «ÂI¦^ÅU ³¹¥½½m²ß ²Ä3³¹ »X¦a¥dùªk 3-1 »X¦a¥dù¹w´ú 3-2 ¦Pµ¦²¤»P²§µ¦²¤ªk 3-3 ¦Pµ¦²¤»X¦a¥dù±±¨î 3-4 ½d¨Ò3.1»Pµ{¦¡½X 3-5 ²§µ¦²¤»P«n©Ê©â¼Ë 3-6 ²§µ¦²¤»X¦a¥dù¹w´ú 3-7 ²§µ¦²¤»X¦a¥dù±±¨î «ÂI¦^ÅU ³¹¥½½m²ß ²Ä4³¹ 1¨B®É¶¡®t¤Àªk 4-1 ®É¶¡®t¤Àªk 4-2 Sarsa©MQ¾Ç²ß 4-3 ½d¨Ò4.1»Pµ{¦¡½X 4-4 ´Á±æSarsa «ÂI¦^ÅU ³¹¥½½m²ß ²Ä5³¹ 5-1 n¨B®É¶¡®t¤À¹w´ú 5-2 n¨BSarsa»Pn¨B´Á±æSarsa 5-3 ½d¨Ò5.1»Pµ{¦¡½X 5-4 ²§µ¦²¤n¨B®É¶¡®t¤À±±¨î «ÂI¦^ÅU ³¹¥½½m²ß ²Ä6³¹ ªñ¦ü¸Ñªk 6-1 ¨ç¼Æªñ¦ü»PÀH¾÷±è«×¤U° 6-2 ¦Pµ¦²¤±è«×»P¥b±è«×¹w´ú 6-3 ¦Pµ¦²¤¦^¦X¦¡¥b±è«×±±¨î 6-4 ½d¨Ò6.1»Pµ{¦¡½X 6-5 ²§µ¦²¤²`«×Qºô¸ô 6-6 ¦Pµ¦²¤®t¤À¥b±è«×±±¨î «ÂI¦^ÅU ³¹¥½½m²ß ²Ä7³¹ ³W¹º»P¾Ç²ß 7-1 ³W¹º 7-2 ½d¨Ò7.1»Pµ{¦¡½X 7-3 Àu¥ý±½±° 7-4 ¤º¦b°Ê¾÷ 7-5 ½d¨Ò7.2»Pµ{¦¡½X «ÂI¦^ÅU ³¹¥½½m²ß ²Ä8³¹ ¸ê®æ¸ñ»P¾Ç²ß 8-1 ¸ê®æ¸ñ©M£f³ø¹S 8-2 ¥b±è«×TD(£f)©M¦^¦X¦¡¥b±è«×Sarsa(£f) 8-3 ¸ê®æ¸ñ©Mªí®æ¸Ñªk 8-4 ½d¨Ò8.1»Pµ{¦¡½X «ÂI¦^ÅU ³¹¥½½m²ß ²Ä9³¹ µ¦²¤±è«×ªk 9-1 µ¦²¤±è«×»Pµ¦²¤°Ñ¼Æ§ó·s 9-2 ²¾ëµ¦²¤±è«×ºtºâªk 9-3 ¼W±jºtºâªk 9-4 ¦æ°ÊªÌµû½×®aºtºâªk 9-5 ½d¨Ò9.1»Pµ{¦¡½X «ÂI¦^ÅU ³¹¥½½m²ß °Ñ¦Ò¤åÄm ¦Wµü¯Á¤Þ
¥b¾ÉÅé²£·~·§½×
¾÷¾¹¾Ç²ß¡G±q²z½×¨ì¹ê
¥b¾ÉÅé¿nÅé¹q¸ô»sµ{§Þ
LabVIEWµ{¦¡³]
¹q¤l¾Ç(°ò¦·§©À)(
¬Ý¹Ï¾ÇC»y¨¥»P¹Bºâ«ä
¹q¸£ºô»Úºô¸ô¡G¥Ñ¤W¦Ó
LabVIEW»P·P´ú
¹Ï¸Ñ¹qºÏ¾Ç¡G±q·§©À¨ì
¶W¹Ï¸Ñ¹q°Ê¨®ªººc³y»P
¬°¤F«O»Ù±zªºÅv¯q¡A·sµ·¸ôºô¸ô®Ñ©±©ÒÁʶRªº°Ó«~§¡¨É¦³¨ì³f¤C¤ÑªºÅ²½à´Á¡]§t¨Ò°²¤é¡^¡C°h¦^¤§°Ó«~¥²¶·©óŲ½à´Á¤º±H¦^¡]¥H¶lÂW©Î¦¬°õÁp¬°¾Ì¡^¡A¥B°Ó«~¥²¶·¬O¥þ·sª¬ºA»P§¹¾ã¥]¸Ë(°Ó«~¡Bªþ¥ó¡B¤º¥~¥]¸Ë¡BÀH³f¤å¥ó¡BÃØ«~µ¥)¡A§_«h®¤¤£±µ¨ü°h³f¡C