Skip to content

DSB #85

Ahoj,

pátek je tu, sobota za rohem, DSB na světě! Doporučil bych článek z business a kariéra, proč a na co si dát pozor u dodavatelů data science řešení. A pak podcast Komerční banky, kde v novém díle prozradí hodně ze své IT kuchyně.

Jako vždy, užijte si čtení.

Analytické

https://towardsdatascience.com/isotonic-regression-is-the-coolest-machine-learning-model-you-might-not-have-heard-of-3ce14afc6d1eIsotonická regrese, přečtěte si stručnou zmínku o její existenci, a proč je v některých případech vhodnější než lineární. (rcmd by reader)

https://github.com/robinsones/funneljoin – Nový package do R pro zpracování sekvenčních dat – tzv. behavior funnels. Optimální pro transakční data či pro clickstream. (rcmd by reader)

https://www.analyticsvidhya.com/blog/2019/12/image-augmentation-deep-learning-pytorch/ – Feature engineering pro obrázky s pomocí image augmentation v PyTorch.

Computer Science & Science

https://arxiv.org/abs/1909.11150 – Jsou společnosti, kde GPU je skoro zázrak, a pak jsou tady týpci, co trénují na 27,600 NVIDIA V100. Někdo to holt rád horké. (rcmd by reader)

https://blog.robotiq.com/whats-new-in-robotics-29.11.2019 – Novinky v robotice.

https://realpython.com/python-descriptors/ – Intro do deskriptorů v Pythonu.

Grafy a vizualizace

https://devmode.fm/episodes/exploring-data-visualization-with-d3-js – Podcast, ve kterém byla hostem Amelia Wattenberger a mluvila o d3.js. (rcmd by reader)

https://www.topbots.com/top-ai-vision-research-papers-2019 – Shrnutí a odkazy na 10 významných paperů z computer vision za rok 2019.

https://www.cryptopolitan.com/who-accepts-bitcoin-infographic/ – Infografika, kdo všechno akceptuje Bitcoin a vůbec, jak a kde se Bitcoin dnes používá.

Business a kariéra

https://www.kdnuggets.com/2019/11/assess-data-science-vendor.html – Jednat o data science řešení není jen tak. Na co si dát pozor, jak zajistit, aby to dávalo smysl a proč si dávat bacha na nablyštěné sliby od externích dodavatelů. (rcmd by reader)

https://hbr.org/2009/07/how-to-get-it-and-the-business-working-together – Jak dát dohromady spolupráci mezi IT a business. (rcmd by reader)

https://thegradient.pub/an-epidemic-of-ai-misinformation/ – Hodně důležitý a dlouhý článek o tom, jak přehnaná očekávání a medializace každé novinky ve výzkumu AI, ubližují celému průmysl a můžou ho i pohřbít. AI winter is coming, pokud si nedáme pozor.

Pop

https://otechnice.cz/google-koupil-fitbit-a-vstupuje-na-trh-nositelnych-zarizeni/ – Google koupil Fitbit. Kromě rozšíření o další hardware produkt tím získal i velmi zajímavá data uživatelů. Zahraniční zdroj zde. (rcmd by reader)

https://medium.com/@jakubbalada/black-friday-2019-s-hl%C3%ADda%C4%8Dem-shop%C5%AF-9a3ddd352a8c – Jako každý rok, i letos je možné si přečíst analýzu o slevách na Black Friday (i mimo) v českých eshopech. (rcmd by reader)

https://www.zdnet.com/google-amp/article/keras-creator-chollets-new-direction-for-ai-a-q-a/ – Rozhovor s tvůrcem Kerasu, který připravil dataset těžkých problémů, čímž chce hecnout vývoj AI, aby nevycházely jen technické papery, které aplikují metody, ale nic nepřináší. (rcmd by reader)

Vzdělávání

https://www.kdnuggets.com/2019/01/solve-90-nlp-problems-step-by-step-guide.html – Pokud Vám chybí vhled do NLP, zkuste tento článek. Popíše Vám, jak NLP v dnešní době funguje a jaké problémy řeší. (rcmd by reader)

https://www.jeremyjordan.me/kubernetes/ – Intro do Kubernetes, jednoho ze standardních nástrojů v data science.

https://www.kdnuggets.com/2019/11/lit-bert-nlp-transfer-learning-3-steps.html – Posuňte svoje znalosti v NLP a nastudujte si BERT v PyTorch. A zde můžete nalézt další rozsáhlý návod včetně vysvětlujících ilustrací a kódu – opět PyTorch.

Data & Data Mining

https://www.peopledatalabs.com/ – Web, kde mají strukturované informace o lidech. 1,5 miliardy záznamů. Pravděpodobně mají v databázi i Vás, pokud žijete digitálně.

https://www.troyhunt.com/data-enrichment-people-data-labs-and-another-622m-email-addresses/ – A ne každému se předchozí odkaz líbí, zvlášť pokud tyto data zneužije/zveřejní třetí strana.

https://docs.google.com/document/d/1Ads4XsCjXmDrdGRgfmm_OgRdpFcl6Qhs6SOllNGyq7Y/edit – Kde všude je možné najít data – desítky různých datových zdrojů.

Video & podcast

https://open.spotify.com/show/4kpsN3hycP1SX0UacOKEj4 – Komerční banka má vlastní podcast o digitálním bankovnictví, a v něm se mimo jiné dozvíte, že má taky Docker. (rcmd by reader)

https://www.youtube.com/watch?v=l_6Tumd8EQI – Deepfake video, napodobující pořad Roundtable od The Hollywood Reporter. Robert Downey, Jr., George Lucas, Tom Cruise, Ewan McGregor a Jeff Goldblum. Místy trošku uncanny valley (hlavně kvůli velikosti hlav), ale už to tam skoro je. Už jsem to viděl asi pětkrát…

https://www.youtube.com/watch?v=OpLU__bhu2w – Počítač z domina? Why not… (rcmd by reader)

Odborné články

https://mastering-shiny.org/ – Hadley Wickham přináší další knížku pro R. Tématem je tentokrát Shiny, package pro tvorbu webových aplikací. Kniha zatím ještě není úplně dokončena. (rcmd by reader)

https://arxiv.org/abs/1811.10154 – Interpretovat některé ML modely je těžké, což může mít negativní důsledky pro důležitá rozhodnutí. Autoři v tomto paperu navrhují preferovat ty, u nichž to problém není. „A malicious systém biased on one feature (say, race) fooled LIME every time and SHAP in 85 percent of cases“. (rcmd by reader)

https://compstat-lmu.github.io/iml_methods_limitations/ – Na téma limitů interpretability modelů je zaměřená i tato den stará kniha, na které se podílel Christopher Molnar, který už mimo jiné napsal Interpretable Machine Learning. (rcmd by reader)

Za ohradou

https://koodi-systems.breezy.hr/p/f8c1abf8670a-senior-data-engineer-python-remote – Senior Data Engineer pro Koodi Systems v San Franciscu.

Vtip

http://devhumor.com/content/uploads/images/December2019/cplusplus_cheating.jpg

Be First to Comment

Leave a Reply