百分之一忘卻的遺跡玩法攻略
百分之一忘卻的遺跡玩法攻略如下:
我是許我再少年,今天帶來(lái)的是忘卻的遺跡玩法的討論。
這個(gè)模式就是有回合限制的三消。4連不消耗回合,5連增加一個(gè)回合。
三消游戲是一個(gè)典型的“game”場(chǎng)景,在機(jī)器學(xué)習(xí)領(lǐng)域,對(duì)于最優(yōu)玩法,簡(jiǎn)單的game可以通過(guò)“搜索”得到,復(fù)雜一些的game可以通過(guò)強(qiáng)化學(xué)習(xí)(reinforcement learning)得到。
先說(shuō)這個(gè)模式的自動(dòng)機(jī)制。它的邏輯就是單步收益最大化的貪心算法,籠統(tǒng)來(lái)說(shuō),屬于最簡(jiǎn)單的“搜索”策略。收益的定義也比較簡(jiǎn)單,有多消優(yōu)先多消,沒(méi)多消優(yōu)先高等級(jí)的寶石。試過(guò)自動(dòng)的容易發(fā)現(xiàn),這個(gè)“AI”的效果比較差。
先岔一下話題,其實(shí)對(duì)戰(zhàn)模式的自動(dòng)“AI”的策略和這個(gè)貪心算法沒(méi)區(qū)別,具體大家都試過(guò)不再展開(kāi)。但是對(duì)戰(zhàn)模式下的AI其實(shí)還行,這是因?yàn)榭ㄅ频募寄軐?duì)戰(zhàn)局影響非常大。一個(gè)是輸出傷害,一個(gè)是刷新棋盤。這使得消除的最佳策略基本接近于單次貪心搜索,考慮多輪消除幾乎不可能,另一個(gè)因?yàn)楣灿闷灞P,這個(gè)場(chǎng)景其實(shí)是博弈場(chǎng)景,而非決策。博弈的核心是預(yù)判對(duì)手的預(yù)判,最終找到納什均衡點(diǎn)。而決策只需要根據(jù)環(huán)境搞收益最大化。本來(lái)博弈場(chǎng)景應(yīng)該更難做ai,但就是因?yàn)榭ㄅ频慕巧容^重,反而使得最優(yōu)消除策略比普通三消要簡(jiǎn)單不少。當(dāng)然,這個(gè)AI水平也不行,比如:
-不考慮當(dāng)下的全部棋盤,比如三消引發(fā)其他位置的四消
-攻擊寶石三連普通寶石優(yōu)先帶一個(gè)高階寶石的情況(這就是程序的問(wèn)題)
回到遺跡模式,上述邏輯主要想論證為什么同樣的貪心策略在這個(gè)看似簡(jiǎn)單的三消模式中效果更差。那么最優(yōu)策略怎么找?熟悉RL的讀者應(yīng)該很容易想到辦法,本質(zhì)上和alphaGo下圍棋類似。需要設(shè)計(jì)一些獎(jiǎng)勵(lì)原則,使得整體reward最大化,顯然回合數(shù)最大化是比較合理的選擇,具體拆分可以舉一些例子,比如:
- 5消最高優(yōu)
- 單步的reward考慮移動(dòng)寶石后所有棋盤上的消除寶石數(shù)量,而不只是移動(dòng)的寶石
- 消除數(shù)量多一點(diǎn)比較好
- 高階寶石應(yīng)該向底部或者四周移動(dòng),避免卡住多消
- 每種類型寶石的reward根據(jù)當(dāng)前棋盤總體寶石分布而定,但總的來(lái)說(shuō)是越高階寶石越礙事
- 4消的價(jià)值沒(méi)有那么大,特別是位于頂部的時(shí)候
以上是我嘗試過(guò)的原則。當(dāng)然,因?yàn)槿四X對(duì)于細(xì)節(jié)的計(jì)算是很費(fèi)力的,所以我打了很多次排名也不算高。人腦善于設(shè)計(jì)模糊原則,在精確優(yōu)化方面,還是弄個(gè)rl模型比較OK
如果官方能開(kāi)放api或者模擬器就好了,可以外包給我做模型。不然還得自己搞模擬器,而且直接放到游戲操作里也很麻煩,沒(méi)準(zhǔn)被當(dāng)外掛給封了。
下面是我的戰(zhàn)績(jī)
可以看到我和第一還是有差距的,不過(guò)排行榜前面的人大多應(yīng)該都退了,也側(cè)面說(shuō)明這個(gè)模式的難度其實(shí)并沒(méi)有那么低
以上就是百分之一忘卻的遺跡玩法攻略相關(guān)內(nèi)容。
百分之一相關(guān)遊戲推薦
0.94GB
24.40MB
54.73MB
423MB
78.36MB
4.19MB
閩公網(wǎng)安備 35021102000359號(hào)
網(wǎng)絡(luò)文化經(jīng)營(yíng)許可證號(hào):閩網(wǎng)文(2016)4364-073號(hào)