Skip to content

DSB #94

Ahoj,

ve výjimečné době vychází páteční bulletin výjimečně v neděli. Vzhledem k tomu, že Covid-19 už nikoho nebaví, tak většina článků se týká jiného tématu. Za sebe bych doporučil např. článek o flash pamětích.

Jako vždy, užijte si čtení.

Analytické

https://towardsdatascience.com/what-you-need-to-know-about-the-new-dplyr-1-0-0-7eaaaf6d78ac – Dplyr čeká velký update na verzi 1.0.0. a s tím souvisí i řada novinek. Výběr sedmi z nich je popsán v článku (např. vzkříšení rowwise()). Pro nedočkavce devtools::install_github(“tidyverse/dplyr”) (rcmd by reader)

https://ff06-2020.fastforwardlabs.com/ – Hodně dlouhé a informací plné čtení o interpretovatelnosti modelů a algoritmů.

https://neptune.ai/blog/image-segmentation-tips-and-tricks-from-kaggle-competitions – Tipy a triky z Kaggle soutěží od preprocessingu dat po evaluování modelu. Prostě hromada užitečných informací.

Computer Science & Science

https://www.root.cz/clanky/ctyricet-let-od-vzniku-mzikovych-pameti-flash/ – Výživný článek popisující historii a vývoj flash pamětí.

https://towardsdatascience.com/why-python-is-not-the-programming-language-of-the-future-30ddc5339b66 – Trošku kontroverze, aneb proč Python podle autora není programovacím jazykem budoucnosti. Doporučuji i reakce na článek. (rcmd by reader)

https://www.quantamagazine.org/computer-scientist-donald-knuth-cant-stop-telling-stories-20200416/ – Rozhovor s Donaldem Knuthem, computer scientistou ze Stanfordu, držitelem Turingovi ceny, který napsal knižní sérii The Art of Computer Programming, které se považuje za jedno z největších děl v téhle oblasti.

Grafy a vizualizace

https://c19simulation.com/indexcz.html – Hezká ilustrační a intuitivní simulace šíření Covid-19 včetně možnosti si nastavovat různé scénáře od studenta gymnázia.

https://medium.com/nightingale/how-john-burn-murdochs-influential-dataviz-helped-the-world-understand-coronavirus-6cb4a09795ae – Rozhovor s Johnem Burn-Murdochem, datovým novinářem z Financial Times, který vytvořil jednu z nejvíc odkazovaných vizualizacích o Covid

https://www.visualcinnamon.com/2020/04/designing-the-hubble-skymap – Autor popisuje, jak vytvořil s pomocí R a Java Scriptu rozsáhlou vizualizaci hvězdné oblohy pozorované Hubblovým teleskopem.

Business a kariéra

https://www.forbes.com/sites/shahinfarshchi/2020/04/10/expect-more-jobs-and-more-automation-in-the-post-covid-19-economy/ – Změní Covid-19 ekonomiku? Povede k větší automatizaci a jak na to reagovat?

https://dfrieds.com/articles/data-science-reality-vs-expectations.html – Data science – očekávání vs realita.

https://www.brookings.edu/research/a-guide-to-healthy-skepticism-of-artificial-intelligence-and-coronavirus/ – Jak si udržet skeptický, ale zároveň zdravý pohled na AI.

Pop

https://www.technologyreview.com/2020/02/25/906083/artificial-intelligence-destroy-civilization-canaries-robot-overlords-take-over-world-ai/ – Jak poznat, že se AI chystá zničit svět?

https://www.technologyreview.com/2020/04/02/998478/ai-machine-learning-social-outcome-prediction-study – Lidská budoucnost je v současnosti stále nepredikovatelná.

https://algorithmwatch.org/en/story/google-vision-racism/ – Google vision vracelo tagy, které byly považovány za rasistické. Tohle téma bude u ML modelů častější a častější.

Vzdělávání

https://medium.com/dataseries/the-top-courses-to-pursue-during-the-lockdown-3ae469f2eec9 – Přehled online AI/ML related kurzů, které jsou dostupné zdarma, tak se inspirujte! (rcmd by reader)

https://www.kdnuggets.com/2020/04/hyperparameter-tuning-python.html – Jak ladit hyperparametry ve třech jednoduchých krocích.

https://lionbridge.ai/articles/difference-between-cnn-and-rnn/ – Jaký je rozdíl mezi CNN a RNN?

Data & Data Mining

https://www.reddit.com/r/MachineLearning/comments/g18xad/im_the_lead_researcher_at_waymo_and_im_here_to/ – Drago Anguelov, Principal Scientist a Head of Research ve Waymo, na redditu odpovídá na otázky ostatních uživatelů ohledně Waymo Open Dataset.

https://datasetsearch.research.google.com/ – Google vytvořil online vyhledávač datasetů.

https://blog.rstudio.com/2020/04/08/great-looking-tables-gt-0-2/ – Pojem, který všichni Rkaři znají, je grammar of graphics – strukturované principy tvorby vizualizací, využité v balíčku ggplot2. Balíček gt se snaží tento přístup replikovat při tvorbě tabulek (grammar of tables). Jeho tvůrce Riche Iannona si můžete poslechnout v podcastu the r podcast zde. (rcmd by reader)

Video & podcast

https://www.youtube.com/watch?v=pbGq3REp4PI&fbclid=IwAR0Ro91sjbHIJEHQrZbCewkTj_bzBfCwRg9N_ZzYAe3yfb2sRW_QtJSnVTk – Moskva má program Safe City, který využívá 178 000 kamer umožňujících rozpoznávání obličeje. (rcmd by reader)

Odborné články

https://mml-book.github.io/ – Zdarma dostupná učebnice matematiky pro ML.

https://arxiv.org/pdf/2003.07082v1.pdf – Stanza, oficiální NLP toolkit od Stanfordu pro Python, který umí 66 jazyků. Zde najdete kód a dokumentaci.

Za ohradou

https://amfam.wd1.myworkdayjobs.com/en-US/AmericanFamilyConnectPropertyCasualtyInsuranceCompany/job/AH-WI-De-Pere-IDS-Prop–Cas-Ins/Data-Scientist_R15660 – Data Scientist v Connectu, v Chicago, USA.

Vtip

https://9gag.com/gag/a7w4PGw?fbclid=IwAR1mgBtsRsmAtAqywQQvlKlmNoWsQHkX8BFBUUB3WLRyqXPzRzQw3pDx9J8 (rcmd by reader)

Be First to Comment

Leave a Reply