31.10.14

Zkušenosti s open source statistickým softwarem

Pro zpracování dat z výzkumů existuje celá řada softwarových nástrojů. Mezi komerčními lze zmínit software jako SPSS, Statistica apod. Nicméně mezi volně dostupnými není úplně jednoduché najít takové, které by fungovaly spolehlivě a byly zároveň uživatelsky přívětivé.

Přitom volně dostupné softwarové nástroje mají potenciálně řadu výhod - uživatelé za ně nemusejí platit a mohou si je snadno nainstalovat na více počítačích, čímž odpadá jedna z hlavních bariér. Na druhou stranu mají i nevýhody - především co se týče spolehlivosti, podpory a uživatelské přívětivosti (např. jazyk).

Pro výuku marketingového výzkumu i na zpracování dat například  jsme si vyzkoušeli řadu z nich, přičemž se nedá říci, že bychom nalezli zcela ideální nástroje. Nicméně jsme našli alespoň takovou variantu, která je funkční a pro většinu úkolů dostatečně dobrá.

V podstatě se jedná o kombinované využití dvou nástrojů, které společně dokáží řešit všechny podstatné nároky, které lze na statistický software mít:
  1. vytvoření kódovacího rámce,
  2. zakódování dat,
  3. transformaci dat,
  4. a statistickou analýzu dat.
Tyto dva nástroje jsou PSPP (využitelný pro kroky 1 - 4)  a R (využitelný především pro kroky 3 a 4, zvládá i řadu pokročilých metod, které PSPP neumí).


PSPP, jak již jeho název napovídá, je do značné míry inspirován jiným známým statistickým software – SPSS. S ním do určité míry sdílí základní logiku ovládání a mimo to i formát ukládaných dat. To dále rozšiřuje možnosti pokročilejší analýzy takto pořízených dat i v dalších statistických nástrojích.

Používání tohoto software je poměrně intuitivní, nicméně vzhledem k tomu, že je tento software vyvíjen především pro operační systém Linux, ne vše ve Windows funguje tak, jak by mělo (například kopírování přes schránku a české znaky v názvech souborů). Proto zde dávám k dispozici Stručný návod k použití PSPP a několik odkazů na další užitečné zdroje v češtině/slovenštině:

Prohledat tento blog