Ahoj,
máme pátek, je na čase rozjet víkend a přečíst si něco z DSB! Doporučil bych dvě věci. Článek o nebezpečnosti open-source knihoven z Computer Science a knížku o IT výzvách v korporátu, která je zmíněna v Popu. Tu by si především měli přečíst lidé zodpovědní za tyto výzvy. No a na závěr určitě nepřeskakujte kategorii Za ohradou, kde je inzerát od britské vlády, kde hledají různé experty (i data scientisty). Něco takového je u nás (v ČR) zatím bohužel nepředstavitelné.
Jako vždy, užijte si čtení.
Analytické
https://github.com/tqdm/tqdm – Progress bar pro Python. Sledujte, kde se nachází Vás for loop. Poradí si i s vnořenými for loopy. (rcmd by reader)
https://slatestarcodex.com/2020/01/06/a-very-unlikely-chess-game/ – Seznamte se, NLG (natural language generation) model GPT-2 od OpenAI umí nejenom generovat text, ale taky hrát šachy, psát poezii a skládat hudbu. (rcmd by reader)
https://teddykoker.com/2019/12/beating-the-odds-machine-learning-for-horse-racing/ – Modelování koňských dostihů, beat them all. (rcmd by reader)
Computer Science & Science
https://medium.com/better-programming/getting-serious-about-open-source-security-1d15609478fa – V čem tkví nebezpečnost open-source knihoven? A jaké kroky přijmout, aby alespoň částečně bezpečné byly? Příklad útoku přes Python knihovnu je zde. (rcmd by reader)
https://pypi.org/project/pretty-errors/ – Python errory v CMD hezky a přehledně! (rcmd by reader)
https://aws.amazon.com/blogs/opensource/announcing-partiql-one-query-language-for-all-your-data/ – PartiQL od Amazonu je nový databázový jazyk, který by umí jak SQL, tak data lakes (Hadoop), tak NoSQL (Mongo). Jedno query pro všechny typy dat. (rcmd by reader)
Grafy a vizualizace
https://bbc.github.io/rcookbook/ – Že BBC pro vizualizace používá ggplot už víme, tak na připomenutí jejich GitHub se všemi tipy a triky. (rcmd by reader)
https://www.bellingcat.com/resources/how-tos/2019/12/26/guide-to-using-reverse-image-search-for-investigations/ – Reverse image search v jednotlivých vyhledávačích. A nejlíp z tohoto srovnání překvapivě nevychází Google, ale ruský Yandex. (rcmd by reader)
https://www.vis4.net/blog/2020/01/2019-too-warm/#/en/2019/12/31 – Globální oteplování je hot topic dnešních dnů, v této vizualizaci najdete časové řadu teplot pro různé oblasti v Německu.
Business a kariéra
https://www.ethanrosenthal.com/2020/01/08/freelance-ds-consulting/ – Jaký to je být data science freelancer? Tady jeden starší kousek za rok 2015.
https://venturebeat.com/2020/01/02/top-minds-in-machine-learning-predict-where-ai-is-going-in-2020/ – Kam kráčí AI v roce 2020 podle ředitele a tvůrce PyTorch, ředitelky výzkumu dětí na Berkeley, šéfa AI v Googlu, ředitelky ML výzkumu v Nvidii, či ředitele výzkumu v IBM?
https://www.paymentssource.com/list/9-transformative-fintech-deals-of-2019 – 9 událostí (akvizicí), které budou formovat bankovní a fintech trh v budoucnu.
Pop
https://itrevolution.com/the-unicorn-project/ – Čtivá, epická IT novela ze světa korporátu, kde postavy čelí výzvám, které bohužel moc dobře známe. „Every company going through a digital transformation needs to make this a must-read for all leaders.” (rcmd by reader)
https://cmo.adobe.com/articles/2018/9/15-mindblowing-stats-about-artificial-intelligence-dmexco.html – Několik zajímavých čísel o AI. (rcmd by reader)
https://www.nytimes.com/2020/01/01/health/breast-cancer-mammogram-artificial-intelligence.html – AI se učí číst mamogramy a učí se to velmi dobře.
Vzdělávání
https://medium.com/better-programming/the-data-science-interview-study-guide-c3824cb76c2e – Tuna odkazů na různé zdroje, knihy, kurzy, videa, které Vám pomůžou naučit se něco nového. (rcmd by reader)
https://github.com/hakluke/how-to-exit-vim/blob/master/README.md – Jak kreativně opustit VIM. Jednu z možností je např. using vim against itself way (executing the buffer) 😀 (rcmd by reader)
https://www.analyticsvidhya.com/blog/2020/01/computer-vision-learning-path-2020/ – Intro do computer vision, odkazy na různé zdroje, jak se co nejlépe dostat do téhle oblasti. Obdobný článek pro NLP je zde, a pro Deep Learning zde.
Data & Data Mining
https://github.com/OpenGeoLabs/ruian-adresy-db – Python skript pro import adresních bodů RUIAN (Registr územní identifikace, adres a nemovitostí) do databáze (PostgreSQL/SQLite). (rcmd by reader)
Video & podcast
https://brocast.cz/34-jan-romportl/ – Jan Romportl, ředitel AI centra v 02 jako host v Brocastu. (rcmd by reader)
https://open.spotify.com/show/4kpsN3hycP1SX0UacOKEj4 – Co znamená pozice Head of Simplification Center of Expertise v Komerční bance. (rcmd by reader)
Odborné články
https://arxiv.org/abs/1912.13213 – Intro do online learningu.
Za ohradou
https://dominiccummings.com/2020/01/02/two-hands-are-a-lot-were-hiring-data-scientists-project-managers-policy-experts-assorted-weirdos/amp/ – Dominic Cummings (Chief Special Adviser to Prime Minister Boris Johnson v UK) hledá data scientisty, manažery a různé experty, aby UK byla ve své politice více efektivní. (rcmd by reader)
Vtip
https://miro.medium.com/max/700/1*x7P7gqjo8k2_bj2rTQWAfg.jpeg (rcmd by reader)
https://twitter.com/tjmcnab/status/1214653879960383492?s=09 (rcmd by reader)
[…] AI Dungeon je unikátní textová hra s otevřeným světem, kompletně postavená na GPT-2 (viz DSB #87). Autoři pro nasazení téhle web záležitosti použili Cortex. Přečtěte si, jak zvládají […]