Skip to content

DSB #91

Ahoj,

bohužel máme pondělí, ale na druhou stranu vychází bulletin! K přečtení doporučuji celou computer science sekci, ale pokud bych měl něco vypíchnout, tak asi dashboardy o koronaviru z Grafů a vizualizací. Je jich tam několik a některé jsou hodně dobré.

Jako vždy, užijte si čtení.

Analytické

https://amitness.com/2020/02/illustrated-self-supervised-learning/ – Self-supervised learning – přehledně a názorně.

https://datascience.columbia.edu/ten-research-challenge-areas-data-science – Deset výzev pro data science research. Užitečné i pro představu, v čem dnešní data science zahálí.

https://graphdeeplearning.github.io/post/transformers-are-gnns/ – O transformer modelech už tu několik článků bylo. Tenhle vysvětluje podobnost mezi GNNs a transformer modely.

Computer Science & Science

https://medium.com/@aidungeon/how-we-scaled-ai-dungeon-2-to-support-over-1-000-000-users-d207d5623de9AI Dungeon je unikátní textová hra s otevřeným světem, kompletně postavená na GPT-2 (viz DSB #87). Autoři pro nasazení téhle web záležitosti použili Cortex. Přečtěte si, jak zvládají více než 1 mil uživatelů. (rcmd by reader)

https://findwork.dev/blog/advanced-usage-python-requests-timeouts-retries-hooks/ – Pokročilé používání Python knihovny requests, aneb hrajeme si s API.

https://ruslanspivak.com/eofnotchar/ – Je EOF (end of file) znak nebo není? Podívejte se, jak tomu je v různých jazycích a jaké to má důsledky.

Grafy a vizualizace

https://www.technologyreview.com/s/615330/best-worst-coronavirus-dashboards/ – Nejhezčí dashboardy o šíření koronaviru. Doporučuji, některé jsou naprosto úžasné.

https://blog.tensorflow.org/2020/02/how-modiface-utilized-tensorflowjs-in-ar-makeup-in-browser.html – Vyzkoušejte si rozšířenou realitu v prohlížeči! V článku se dozvíte, jak ModiFace pro modelování v TensorFlow.js využívají MobielNetV2. (rcmd by reader)

https://cultivating-algos.stitchfix.com/ – Krásná vizualizace, která ukazuje, jakou má data science roli ve firmě Stitch Fix, která Vám vytvoří personalizovaný stylový šatník.

Business a kariéra

https://eugeneyan.com/2020/02/28/psych-grad-to-vp-data-science – Jak se s titulem z psychologie můžete stát data scientistou, pro inspiraci.

https://vicki.substack.com/p/data-centers-are-the-new-oil – O datech se říká, že jsou nová ropa/olej (new oil). Ve skutečnosti to ale platí pro datová centra. „He who builds the servers makes the rules.

https://www.cnbc.com/2020/02/28/technology-is-making-personal-finance-easier-for-everyday-americans.html – Hezký článek o tom, v čem tkví potenciál optimalizace osobních financí klienta. Kde se mu dá pomoci, jak a proč.

Pop

https://www.theguardian.com/science/2020/feb/27/why-your-brain-is-not-a-computer-neuroscience-neural-networks-consciousness – Že se neuronky přirovnávají k mozkovým neuronům, anebo mozek k počítači, je už koloritem. Přečtěte si ale v čem se liší a proč je tohle přirovnání dost zavádějící.

https://www.theverge.com/2020/2/27/21155254/automation-robots-unemployment-jobs-vs-human-google-amazon – Dlouhý článek o tom, jak roboti paradoxně dělají práci těžší a těžší.

https://www.nature.com/articles/d41586-020-00018-3 – Vědci s pomocí ML vytvořili antibiotika proti rezistentním bakteriím.

Vzdělávání

https://www.analyticsvidhya.com/blog/2020/03/one-hot-encoding-vs-label-encoding-using-scikit-learn/ – One-Hot Encoding známe nejenom z NLP všichni. Kdy se rozhodnout mezi ním a label encoding?

https://vas3k.com/blog/machine_learning/ – Většina z nás nic podobného už nepotřebuje, ale pokud si chcete projít hezky udělaný a zábavně pojatý intro do ML, tak tohle je ta správná volba.

https://github.com/bradleyboehmke/data-science-learning-resources – Zdroje (hlavně články a knihy) pro studium data science. Podobných už tu bylo víc než dost, na druhou stranu seznam, který obsahuje The Pragmatic Programmer, nelze opominout.

Data & Data Mining

https://datasets.quantumstat.com/ – NLP databáze – mnoho datasetů v mnoha formátech pro mnoho účelů.

Video & podcast

https://www.youtube.com/watch?v=ZTXFQ2sEarQ – Wes McKinney, autor Pandas, mluví o historii, současnosti a budoucnosti Python ekosystému na PyCon Colombia 2020. (rcmd by reader)

https://www.youtube.com/watch?v=Kx-2PyrhnFE – Když už je v tomto díle zmíněn AI Dungeon, tak pro ty, co už ví, o co se jedná, je tohle video povinností 😀

https://www.analyticsvidhya.com/blog/2020/03/10-powerful-talks-by-women-in-data-science/ – V neděli bylo MDŽ, v rámci té příležitosti přišel Analytics Vidhya se seznamem 10 inspirujících přednášek od žen v data science.

Odborné články

https://arxiv.org/abs/2002.12327 – Používáte NLP modely a nevíte, jak fungují? V klidu, v případě BERTa to zatím neví skoro nikdo. Respektive, v uvedeném paperu se můžete dozvědět, co nyní známo je.

https://github.com/dair-ai/nlp_paper_summaries – GitHub repozitář s NLP papery.

https://github.com/ctgk/PRML – Python kód pro algoritmy z knihy Pattern Recognition and Machine Learning.

Za ohradou

https://www.linkedin.com/jobs/view/data-scientist-at-two-sigma-1312008569/ – Data Scientista v Two Sigma, v New Yorku, USA.

Vtip

https://i.redd.it/961lqp4ed9i41.png

Be First to Comment

Leave a Reply