pandas
A pandas (kiejtve: pendöz) egy kiegészítő csomag a Python programozási nyelvhez, ami adatok feldolgozására és elemzésére használható. Ehhez egy adatbázis oszlopához hasonló Series, és egy adatbázis táblához hasonló DataFrame nevű adatszerkezetet tesz elérhetővé.
A pandas segítségével számtalan különböző formátumból (pl. Excel, CSV, JSON, SQL, HTML tábla) beolvashatsz adatokat, áttekintést kaphatsz róluk, kezelheted a hibás vagy hiányzó részeket (adattisztítás), átalakíthatod, rendezheted, szűrheted, illetve a Matplotlib-el grafikonon ábrázolhatod őket. Az adatok kezelését gyors, C nyelven írt kód végzi.
A pandas a NumPy kiegészítő csomagra épül, nyílt forráskódú és ingyenes. Gyakran használják az adattudomány, adatelemzés és a gépi tanulás területén.
A név a panel data kifejezésből ered (ami az ökonometriában azt jelenti, hogy valamiről több különböző időből származó adataink vannak), ugyanakkor utalás a "Python Data Analysis" kifejezésre is. A szót kisbetűvel kell kezdeni, hivatalosan még akkor is, ha egy mondat elején szerepel.
Bővebben: pandas alapok (Faragó Csaba)
Publikálva: 2022. szeptember 16.

A pandas logója (pandas.pydata.org)