Ahoj,
přichází další díl bulletinu, tentokrát už ve středu. Pokud budete mít nějaký nápady a návrhy ke změně bulletinu (kromě zrušení :D), články či odkazy, které byste chtěli šířit, tak mi dejte vědět, určitě to zapracuji. Např. minule jsem se dozvěděl, že jakmile odkaz nejde rozkliknout, ale musí se zkopírovat, téměř nikdo to neudělá… To bylo cenné ponaučení nejen pro tvorbu bulletinu.
Užijte si čtení.
Analytické
https://arstechnica.com/information-technology/2017/06/according-to-statistics-programming-with-spaces-instead-of-tabs-makes-you-rich/ – Měli bychom zapřemýšlet, jak píšeme kód. (rcmd by reader)
http://www.zive.cz/bleskovky/stackoverflow-vyvojari-kteri-odsazuji-kod-mezerami-jsou-bohatsi-nez-ti-kteri-pouzivaji-tabulator/sc-4-a-188153/default.aspx – Obsahově ta samá zpráva, ale česky. (rcmd by reader)
https://www.nature.com/news/the-mathematicians-who-want-to-save-democracy-1.22113 – Trošku off topic, ale zajímavý článek o tom, jak se dají ovlivnit americké volby tvorbou volebních oblastí (manipulováním s hranicemi volebních obvodů, viz https://cs.wikipedia.org/wiki/Gerrymandering ) a jak to s pomocí matematiky a statistiky napravit.
http://news.efinancialcareers.com/uk-en/285249/machine-learning-and-big-data-j-p-morgan – V minulém díle jsem posílal odkaz na 280 stránkový report od JP Morgan. Tady je výborný článek, který tento report shrnuje do jedné A4. Doporučuji. Téměř každý bod ukazuje cestu, kterým směrem se celý obor data science vyvíjí.
https://blog.statsbot.co/time-series-anomaly-detection-algorithms-1cef5519aef2 – Časové řady a různé metody, jak identifikovat anomálie.
https://shiring.github.io/forecasting/2017/06/09/retail_forcasting_part2 – Opět časové řady, druhý díl, který navazuje na odkaz z minulého bulletinu. Tentokrát jde o predikce. Včetně kódu.
http://kateto.net/network-visualization – Wow. Vyčerpávající článek o tom, jak vytvářet síťové grafy v R (včetně kódu a podrobného postupu).
Business
https://thenewstack.io/instagram-makes-smooth-move-python-3/ – Jak se dá elegantně přejít na Python 3 a zároveň, proč je Python tak oblíbený a tak šikovný jazyk (rcmd by reader).
https://insidebigdata.com/2017/06/18/big-data-game-changer-music-industry/ – „Songs are data after all. From this large collection of data, a gigantic “store” might be created over time. The artists can opt into data revenue sharing thus offering more control of the direction of their art.“
https://insidebigdata.com/2017/06/19/total-commerce-success-retail-hinges-agile-data/ – „Many retailers recognize that their current IT systems were built for a retail era that no longer exists and this keeps them from being able respond and pivot in today’s terms. But you can’t blame businesses for not always knowing exactly what steps to take next.“
https://insidebigdata.com/2017/06/15/5-tips-prepare-big-data-analytics/ – Pět tipů, jak připravit společnost na big data (líbí se mi hned ten první: „Do Not Get Your Hopes Too High!“)
Vzdělávání
https://www.udemy.com/the-ultimate-hands-on-hadoop-tame-your-big-data/ – Udemy kurz na hadoop. BTW dnes v devět ráno končí na udemy slevy. (rcmd by reader)
http://www.mlmu.cz/archiv/ – Přehledný archiv všech historických machine learning meetupů, ať už z Prahy nebo z Brna, včetně videí a slidů.
Události
http://www.mlmu.cz/praha/ – Další meetup 28. června proběhne tradičně v Paralelním Polis a tentokrát na téma Machine Learning and Deep Learning with H2O. Přednášejícím bude Jo-fai Chow (https://uk.linkedin.com/in/jofaichow) , což je podle všeho opravdový data scientist. Týpek má taky hromadu absolvovaných online kurzů. Bohužel, na webu dosud není aktualizovaný program o přednášce.
Vtip
https://xkcd.com/1306/ (rcmd by reader)
[…] – Gerrymandering se tu už v minulost objevil. Přečtěte si, jak nastavení systému může výrazně ovlivnit výsledky voleb. (rcmd by […]