14.06.2014, 23:18
(Tento příspěvek byl naposledy změněn: 14.06.2014, 23:39 uživatelem pidi. Edited 1 time in total.)
*To je na nejtěžší obtížnost.
Ad "není nutné", mrkni třeba sem http://gomocup.org/ Podobné brainy jsme psali v druháku jako povinný projekt do základů umělé inteligence. Btw. i piškvorky od Atari z roku 1979 prohledávají stavový prostor do hloubky 8. Velikost hracího plánu je sice jen 8*8 takže ta exploze stavů není tak brutální, ale přesto... na 1.7MHz a 16kB RAM...
Zkus poladit ohodnocení. Statisticky se proti lidem ukázalo, že je vhodné mít mírně útočnou strategii. Máš velmi nadhodnocené čtveřice. Vznik dvojice trojic, z nichž jedna je volná a jedna z jedné strany blokovaná musí mít vyšší prioritu než vznik z jedné strany blokované čtveřice atd. Tady je značná rezerva i v současném stavu. Nakresli si ty situace na papír a ty vzájemné závislosti budou zřejmé. I bez prohledávání minmaxem lze napsat brain který hraje mnohem tvrději. Pokud vhodně zvolíš poměry, můžeš je pro "hráče" a pro "počítač" násobit nějakou bulharskou konstantou a udělat z toho krásný slider "Obrana - Útok" v menu.
Zkusil bych prohledat kompletní stavový prostor cca do hloubky 3-4. Následně vybrat nejlépe ohodnocené kandidáty a s nimi provést to samé, to samé, to samé, dokud bude přijatelný čas. Je vhodné omezit to prohledávání maximálním časem na tah a v průběhu hledání si udržovat best-so-far kandidáta. To budou souřadnice pole které vrátíš když ti prohledávání přeruší čas. Dostaneš se tak na mnohem větší hloubku.
Když se tohle vychytá, dá se doprogramovat Back Propagation a statistiky proti sobě pouštět vlastní/cizí, resp předchozí a aktuální verzi algoritmu. Ohodnocení pravidel pak bude řídit neuronovka. Naučená síť se pak umí adaptovat a konkrétní chyby protihráče. Není to tak složitý, jak se může zdát.
Poslední věc (hloupost) co mi vrtá hlavou je ta nedetekce šestic. Pokud existuje šestice, pak najdu i dvojici pětic. A nalézt stačí první z nich. Navíc to jde zjistit už při prvním průchodu, tak proč ti to nefunguje? Přece umístím symbol uvažovaného tahu a projdu jeho 81-okolí a spočítám ohodnocení. Všechny pětice i vícetice tak najdu okamžitě... ...to bude nějaká školácká chybka...
Ad "není nutné", mrkni třeba sem http://gomocup.org/ Podobné brainy jsme psali v druháku jako povinný projekt do základů umělé inteligence. Btw. i piškvorky od Atari z roku 1979 prohledávají stavový prostor do hloubky 8. Velikost hracího plánu je sice jen 8*8 takže ta exploze stavů není tak brutální, ale přesto... na 1.7MHz a 16kB RAM...
Zkus poladit ohodnocení. Statisticky se proti lidem ukázalo, že je vhodné mít mírně útočnou strategii. Máš velmi nadhodnocené čtveřice. Vznik dvojice trojic, z nichž jedna je volná a jedna z jedné strany blokovaná musí mít vyšší prioritu než vznik z jedné strany blokované čtveřice atd. Tady je značná rezerva i v současném stavu. Nakresli si ty situace na papír a ty vzájemné závislosti budou zřejmé. I bez prohledávání minmaxem lze napsat brain který hraje mnohem tvrději. Pokud vhodně zvolíš poměry, můžeš je pro "hráče" a pro "počítač" násobit nějakou bulharskou konstantou a udělat z toho krásný slider "Obrana - Útok" v menu.
Zkusil bych prohledat kompletní stavový prostor cca do hloubky 3-4. Následně vybrat nejlépe ohodnocené kandidáty a s nimi provést to samé, to samé, to samé, dokud bude přijatelný čas. Je vhodné omezit to prohledávání maximálním časem na tah a v průběhu hledání si udržovat best-so-far kandidáta. To budou souřadnice pole které vrátíš když ti prohledávání přeruší čas. Dostaneš se tak na mnohem větší hloubku.
Když se tohle vychytá, dá se doprogramovat Back Propagation a statistiky proti sobě pouštět vlastní/cizí, resp předchozí a aktuální verzi algoritmu. Ohodnocení pravidel pak bude řídit neuronovka. Naučená síť se pak umí adaptovat a konkrétní chyby protihráče. Není to tak složitý, jak se může zdát.
Poslední věc (hloupost) co mi vrtá hlavou je ta nedetekce šestic. Pokud existuje šestice, pak najdu i dvojici pětic. A nalézt stačí první z nich. Navíc to jde zjistit už při prvním průchodu, tak proč ti to nefunguje? Přece umístím symbol uvažovaného tahu a projdu jeho 81-okolí a spočítám ohodnocení. Všechny pětice i vícetice tak najdu okamžitě... ...to bude nějaká školácká chybka...
Největší pohroma téhle malé země se jmenuje spravedlivě nasraný a žlučovitý Čech...
This ain't no place for no hero. This ain't no place for no better man. This ain't no place for NZ hero to call home...
This ain't no place for no hero. This ain't no place for no better man. This ain't no place for NZ hero to call home...