Lexiq

Random forest

A random forest (vagy magyarul véletlen erdő) egy gépi tanulásban és adatbányászatban használt klasszifikációs és regressziós módszer, aminek a lényege, hogy több különböző döntési fát hoz létre, és ezek eredményeinek átlagolásával (vagy klasszifikáció esetén a legtöbb szavazatot kapott eredmény kiválasztásával) adja meg a végeredményt.

a döntési fák létrehozásának és átlagolásának képi ábrázolásaA véletlen erdő módszer a döntési fákhoz képest jobb eredményt szokott adni, és kisebb eséllyel esik a túltanulás hibájába.

Ahhoz, hogy a módszer jól működjön, az szükséges, hogy az egyes döntési fák a véletlennél jobban teljesítsenek, illetve hogy az előrejelzéseik (és így a hibáik) egymástól viszonylag függetlenek legyenek, azaz kicsi legyen köztük a korreláció. A több döntési fa együttes alkalmazása így ki tudja szűrni az egyes döntési fák által vétett hibákat.

A véletlen erdő két módszert használ a különböző döntési fák létrehozására: