Er Python málið?

Já.

Nú viltu rökstuðning líka? Ókey, látum okkur sjá.

Python er alla vega gríðarlega vinsælt, samkvæmt PYPL mælikvarðanum á vinsældir forritunarmála eru nálægt tvisvar sinnum oftar leitað að upplýsingum um notkun Python en þess næst vinsælasta, sbr. pypl.github.io/PYPL.html.

En raun er forritunarmálið sjálft nánast aukaatriði, það er reyndar mjög fjölhæft, að sumu leyti fallegt og sannarlega til margra hluta nytsamlegt, en hannað til að gera ákveðna hluti vel á kostnað annarra. Gárungarnir segja að Python sé ekki besta forritunarmálið til að leysa neitt verkefni en það sé hins vegar næst besti valkosturinn til að leysa öll verkefni.

Aðalatriðið eru pakkarnir, viðbótarvirkni sem hver og einn getur sótt eftir því sem hentar þeirra verkefnum. Gagna-Magnús er sérlegur áhugamaður um allt sem viðkemur gögnum og greiningu þeirra. Hér verður því tæpt á helstu pökkum sem lúta að þeim viðfangsefnum.

NumPy er undirstöðupakki sem er sjaldan notaður einn og sér en er bakbeinið í fjölmörgum öðrum pökkum. NumPy er hannað til hraðvirkrar og þægilegrar meðhöndlunar á fjölvíðum gagnasettum af sama tagi, þ.e. vigrum, fylkjum og þinum (vector, matrix, tensor).

Pandas byggir á NumPy og vinsælasti pakkinn til að vinna með gögn af öllu tagi. Grunneining í Pandas er DataFrame sem má bera saman við flipa í Excel skjali. Hér sækir þú gögn, klappar þeim og gerir klár fyrir greiningu og skrifar mögulega niðurstöður til baka í gagnagrunn.

Bæði NumPy og Pandas bjóða upp á einföld gröf fyrir myndræna birtingu, en Matplotlib og Seaborn pakkarnir eru vinsælir til birtingar á fjölbreyttum gröfum með miklum sveigjanleika. Matplotlib er talið aðgengilegra og Seaborn öflugra.

SciPy byggir líka á NumPy og vinnur saumlaust með Pandas. Hér byrjar fjörið hjá gagnavísundunum, líkön af ýmsum toga eru þjálfuð og gæðametin. Hér er líka að finna góðan stuðning við línulega algebru, tölulega greiningu og ýmiss konar tölfræði.

Fyrir þá sem eru á blábrúninni í hagnýtingu gagnavísinda bætist við valkvíðann, því hér keppa nokkrir pakkar um hylli notenda, t.d. PyTorch, TensorFlow, Scikit-learn og Keras. Hér er smá umfjöllun á þessa valkosti.

Svo eru pakkar til að tengjast vefþjónustum, skrapa vefsíður, vinna myndgreiningu, fyrir prófanir og fleira. Allt eru þetta almennir pakkar sem eru ekki sértækir fyrir ákveðin vísinda- eða viðskiptasvið. En að sjálfsögðu er til ógrynni sértækra pakka. Viltu fara í pakkaleik? Kíktu þá á pypi.org.