Lexiq

MNIST adatbázis

Az MNIST adatbázis (kiejtve emniszt adatbázis) kézzel írt számjegyek képét tartalmazó adatbázis, amit gyakran használnak a gépi tanulás területén, például egyes algoritmusok bemutatásakor, tanításakor.

Az adatbázis 70000 darab 28x28 pixel méretű szürkeárnyalatos képet tartalmaz, amikből 60000 felhasználásával tanítják meg a számítógépet a számjegyek felismerésére, és 10000 képen tesztelik a tanulás sikerességét. A jobb algoritmusok az emberekhez hasonlóan teljesítenek a feladatban.

Az MNIST a Modified National Institute of Standards and Technology kifejezés rövidítése, ami arra utal, hogy az eredeti NIST adatbázishoz képest változtatásokat végeztek rajta, hogy a gépi tanuláshoz megfelelőbb adatokat tartalmazzon. Létezik egy bővített változat is EMNIST (Extended MNIST) néven, ami számok mellett kis- és nagybetűket is tartalmaz.

Az adatbázis Pythonban könnyen elérhető a "from keras.datasets import mnist" parancs segítségével.

Publikálva: 2022. szeptember 22.