Kérdés:
Számítógépes értékelések: Mennyire megbízhatóak?
chubbycantorset
2012-12-30 12:31:30 UTC
view on stackexchange narkive permalink

A Fritz 12 Rybkával egy barátomnak +3 értéket adott a fehérre ebben a végjáték pozícióban,

  [Cím "Fehér a mozgáshoz"] [ FEN "8/8/8 / 3k3p / 3P3K / 2P3R1 / 8 / 7r w - - 0 1"]  

amely döntetlennek bizonyult. De hallottam, hogy a +3 számítógépről garantált győzelmet jelent tökéletes játék mellett. Csak rosszul hallottam? Hogyan kell értelmezni a számítógépes értékeléseket általánosságban? Mit is jelentenek az <.5 nyitási előnyei?

Kihívnám a "garantált győzelem" megjegyzést. Az értékelő szám heurisztikus mutató, alapvetően egy olyan "érzés", amelyet a számítógép a pozícióval kapcsolatos. A végjátékok "meglepő" eredménnyel járhatnak, és hacsak a számítógépet nem programozták be az összes lehetséges minta észlelésére (vagy képes végig számolni), hiányozni fog néhányuk. Másképp nézve, ha a +3 valóban garantált lenne, akkor nem +3 lenne, hanem a + végtelen.
Ami a helyzetet illeti, a Lichess 7 részes asztallapjaival ellenőriztem, és ez valóban döntetlen.
Három válaszokat:
ETD
2012-12-31 01:42:19 UTC
view on stackexchange narkive permalink

A különböző motorok számértékeléséhez eltérő "skála" van. Például egy tipikus középpályás pozícióban, ahol rengeteg játék van hátra, amikor Houdini azt mondja, hogy +2,00 vagy annál jobb, nagyon valószínű, hogy White győztes előnnyel rendelkezik (bár még itt is okkal vettem fel a képesítéseket). De fontold meg: módosíthatnánk Houdini forráskódját, és megduplázhatnánk az értékelésben részt vevő összes szám abszolút értékét; kapunk egy azonos erősségű motort, amely azonos játékot eredményez, de most a +4,00 azt jelenti, amit a +2,00 korábban jelentett. Ez azt szemlélteti, hogy nem szabad elvárni az egységes számszerű küszöböt a motorok között , amely általában nyerő előnyt jelent.

Ennélfogva fontos azonban megérteni, hogy a motor numerikus értékelése a helyzet (szemben az elkerülhetetlen társ nyilvánvaló kijelentésével) soha nem jelent szigorúan „nyert játékot”, még egyetlen, fix motor esetében sem. Kulcsfontosságú tény, hogy a numerikus értékeléseknek nincs egyértelmű "értelme" tág sakkfogalmakkal, és inkább csak az érző gondolat helyettesítői, amelyet arra használnak, hogy mechanikusan irányítsák a motort az általánosan kívánatos eredmények felé azáltal, hogy befolyásolják, hogy az egyes pontokban melyik mozgást választja a játékban; ennek fényében a motor játékának végső soron az a legfontosabb, hogy csak a lehetséges mozgásokhoz rendelt értékelés különbsége je legyen, semmint az érintett abszolút értékek ről. A számok hasznosak maguknak a motoroknak, amelyekre valami konkrétumra van szükségük ahhoz, hogy döntést hozzanak az egyik lépésről a másikra, de nekünk, embereknek nem szabad túl gyorsan elolvasnunk több jelentést az olyan gondolatok nagyságrendjében, mint a "+ X győzelem. "

Különösen minél előrébb jutunk a végjáték felé, szemben a középjátékkal, annál kevésbé használhatunk ökölszabályt (például a fenti Hudinihez tartozó +2,00-ot a középső játékokban) arról, hogy egy bizonyos küszöbérték elegendő a győzelemhez . Ennek egyik fő oka az a nehézség, hogy a motorok felismerik az erődöket, ahol a rengeteg extra anyag még mindig nem elegendő a győzelemhez. Például, amikor a Stockfish etetem ezt a helyzetet,

  [FEN "5k2 / 6p1 / 5r2 / 3Q3P / 4K3 / 8/8/8 w - - 0 1"]  

pár perc múlva úgy gondolta, hogy ez körülbelül +7,00 értéket ad, és egy tipikus helyzetben, amikor Stockfish ezt mondja, akkor szinte biztos, hogy győzelem van a kezedben. Mindazonáltal ez holtverseny, és az ember ezt könnyedén láthatja, ha rájön a tényre, hogy Fekete csak megkeverheti a tornyot f6 és h6 között, és így (1) a h-gyalog haszontalan, és (2) a fehér király soha nem lesz képes segíteni a fehér királynő támadásában. Végül a Stockfish itt is felismeri a döntetlent, ha mondjuk 50 mozdulattal szemben eltalálja, vagy végül elfogynak a különböző mozdulatok, és végül nem tudja elkerülni az ismétlést, de ezek az események lefelé a keresési mélység vonalán.

A korábbi kérdés, amelyet Ön linkelt, végjáték-helyzete hasonlít az efféle erődhöz, annyiban, hogy az extra összekapcsolt fehér gyalogok, a White, vannak szépek és mindenek, de végül nem elég ahhoz, hogy ebben a helyzetben nyerjen. Ha egy motor elég ideig számolna, hogy annyi információt lásson, amennyit a táblázatok tartalmaznak, akkor az értékelése 0-ra csökken, de addig az értékelési algoritmusának nincs jobb folytatása, mint hogy + -ot adjon ehhez extra anyag (amelyet még nem tud, értelmetlen).

+1 a * -hoz "Ennél azért fontos megérteni, hogy a pozíció numerikus motorértékelése (szemben az elkerülhetetlen társ teljes kijelentésével) soha nem jelenti szigorúan megnyert játékot" *
Thomas Ahle
2014-03-09 23:04:32 UTC
view on stackexchange narkive permalink

Úgy gondolom, hogy ez a kép elég jól leírja a helyzetet. 400 ezer játékból készült, és csak egyszerű darabokat vesz figyelembe.

Win Probability/Pawn Advantage

Forrás: Pawn Advantage, Win Percentage és ELO

Szép hozzájárulás! +1
@Thomas Ahle: A grafikon érdekes. De az eredeti cikk már nem érhető el, a wikispaces link sajnos lecsökkent. Emlékszik a W = Nyerési valószínűség pontos jelentésére? Győzelem és veszteség volt a sorsolás figyelmen kívül hagyása mellett? Vagy "várható pontszám" volt, figyelembe véve a döntetleneket?
@Diedrsch Frissítettem a linket
Tony Ennis
2012-12-30 21:06:34 UTC
view on stackexchange narkive permalink

Van itt néhány dolog.

Először is, minden programnak megvan a maga módszere a pozíciók értékelésére, így a pontszámokat nem lehet közvetlenül összehasonlítani. Például nemrégiben a StockFish-t futtattam a Rybka ellen, és megállapítottam, hogy a Stockfish pontszáma kb. Ezen meglepődtem, de teljesen egyértelmű, hogy az 1-es pontszám nem mindig jelenti az "1 gyalogot". Azt hiszem, amit meg kell néznünk, hogy változik a pontszám. Egy másik érdekesség, amit tegnap láttam (miközben véletlenül megválaszoltam az egyik másik kérdésedet), hogy a Stockfish értékelési algoritmusa nem nagyon szereti a páratlan számokat. Valójában a legtöbb pontszám a 0,04 többszöröse volt. Tekintettel arra, hogy az érték nagysága tetszőleges, nem feltételezném, hogy egy bizonyos érték "biztos győzelmet" jelent, hacsak a gép nem állítja, hogy társra talált.

Másodszor, a végjáték táblázatait azért hozták létre, mert az end megoldása játékok nagy keresési mélységet igényelnek. A verseny sebességével játszó számítógépek egyszerűen nem csinálják jól. Néhány nappal ezelőtt egy másik játékon dolgoztam, és ezen az oldalon jelentettem be, hogy az egyik fél előnyben van. Ed egy asztallappal megmutatta, hogy nem maradt rejtély a helyzetben - elméletileg megrajzolták. Természetesen óriási különbség van a tökéletes játékkal rajzolt és a rajzolt között; a játékosoknak meg kell találniuk a megfelelő lépéseket.


A White-nak általában a játék korai szakaszában adott kis érték azt jelenti, hogy a white értékesebb ingatlanokat követelhet. Például az 1. lépésben White e4-et követelhet, és megtámadhatja az e5 és az f5-öt. Fekete képes ellensúlyozni. De akkor White játszhat Nc3-mal, és támadhatja / megerősítheti az a4, b5, d5 és e4 játékokat. De Black képes ellensúlyozni. Tehát nagyon keveset jelent.


Végül, hogy megválaszoljam a témakörében szereplő kérdést - az értékelések nagyon megbízhatóak, mivel kemény tényeken és lenyűgöző keresési mélységen alapulnak. Természetesen a gépek nem tévedhetetlenek. De nekünk, b-játékosoknak emlékeznünk kell arra, hogy a Stockfish (vagy Rybka) GM erősségekkel játszik szerény hardveren. A legjobb közös hardveren a FIDE 3200-ra becsülik az értékelésüket. Ez olyan magas, hogy csak a legjobb embereknek van némi esélyük arra, hogy ne veszítsenek.

Gondoljon bele, mit jelent ez; Nekem (USCF 1650-ish) nincs esélyem olyan személlyel szemben (mondjuk 2050-es USCF-rel), akinek nincs esélye olyan személlyel szemben (mondjuk: USCF 2450), akinek nincs esély olyan személlyel szemben (mondjuk: USCF 2850), akinek egy rész es esélye van egy csúcsminőségű kereskedelmi programmal szemben (FIDE 3200).

Így amikor Stockfish azt mondja, hogy az egyik lépés jobb, mint a másik, akkor általában névértéken veszem. Amikor bekapcsolom a végjáték táblázatait, ez a dolog elkezd bejelenteni a 30-asokat, lol.

Nagyon szép válasz. Mindig azt gondoltam, hogy az 1 értékelése 1 gyalognyi anyagot jelent. Ezenkívül a chesstempo azt mondja, hogy problémáiban az a legjobb lépés (ek), amelyek legalább 2 gyalog értékű anyagot nyernek, ezért úgy ítéltem meg, hogy a +2 vagy annál nagyobb motorértékelés nyerő a játék szakaszától függetlenül. Azonban a tőkehal elemzését korábban hibásnak találtam, és láttam, hogy nem sikerül megfelelően értékelni a végjátékokat. Ezen a megjegyzésen tudod, hol találok egy végjátékokat tartalmazó táblázatot?
Itt van az online 6 fős asztali Ed közzétéve: http://www.k4it.de/index.php?topic=egtb&lang=en
+1 * értéknél: "Nem feltételezném, hogy bizonyos érték azt jelentené, hogy" biztos győzelem ", hacsak a gép nem állítja, hogy társat talált." *


Ezt a kérdést és választ automatikusan lefordították angol nyelvről.Az eredeti tartalom elérhető a stackexchange oldalon, amelyet köszönünk az cc by-sa 3.0 licencért, amely alatt terjesztik.
Loading...