Ahoj,
ve výjimečné době vychází páteční bulletin výjimečně v neděli. Vzhledem k tomu, že Covid-19 už nikoho nebaví, tak většina článků se týká jiného tématu. Za sebe bych doporučil např. článek o flash pamětích.
Jako vždy, užijte si čtení.
Analytické
https://towardsdatascience.com/what-you-need-to-know-about-the-new-dplyr-1-0-0-7eaaaf6d78ac – Dplyr čeká velký update na verzi 1.0.0. a s tím souvisí i řada novinek. Výběr sedmi z nich je popsán v článku (např. vzkříšení rowwise()). Pro nedočkavce devtools::install_github(“tidyverse/dplyr”) (rcmd by reader)
https://ff06-2020.fastforwardlabs.com/ – Hodně dlouhé a informací plné čtení o interpretovatelnosti modelů a algoritmů.
https://neptune.ai/blog/image-segmentation-tips-and-tricks-from-kaggle-competitions – Tipy a triky z Kaggle soutěží od preprocessingu dat po evaluování modelu. Prostě hromada užitečných informací.
Computer Science & Science
https://www.root.cz/clanky/ctyricet-let-od-vzniku-mzikovych-pameti-flash/ – Výživný článek popisující historii a vývoj flash pamětí.
https://towardsdatascience.com/why-python-is-not-the-programming-language-of-the-future-30ddc5339b66 – Trošku kontroverze, aneb proč Python podle autora není programovacím jazykem budoucnosti. Doporučuji i reakce na článek. (rcmd by reader)
https://www.quantamagazine.org/computer-scientist-donald-knuth-cant-stop-telling-stories-20200416/ – Rozhovor s Donaldem Knuthem, computer scientistou ze Stanfordu, držitelem Turingovi ceny, který napsal knižní sérii The Art of Computer Programming, které se považuje za jedno z největších děl v téhle oblasti.
Grafy a vizualizace
https://c19simulation.com/indexcz.html – Hezká ilustrační a intuitivní simulace šíření Covid-19 včetně možnosti si nastavovat různé scénáře od studenta gymnázia.
https://medium.com/nightingale/how-john-burn-murdochs-influential-dataviz-helped-the-world-understand-coronavirus-6cb4a09795ae – Rozhovor s Johnem Burn-Murdochem, datovým novinářem z Financial Times, který vytvořil jednu z nejvíc odkazovaných vizualizacích o Covid
https://www.visualcinnamon.com/2020/04/designing-the-hubble-skymap – Autor popisuje, jak vytvořil s pomocí R a Java Scriptu rozsáhlou vizualizaci hvězdné oblohy pozorované Hubblovým teleskopem.
Business a kariéra
https://www.forbes.com/sites/shahinfarshchi/2020/04/10/expect-more-jobs-and-more-automation-in-the-post-covid-19-economy/ – Změní Covid-19 ekonomiku? Povede k větší automatizaci a jak na to reagovat?
https://dfrieds.com/articles/data-science-reality-vs-expectations.html – Data science – očekávání vs realita.
https://www.brookings.edu/research/a-guide-to-healthy-skepticism-of-artificial-intelligence-and-coronavirus/ – Jak si udržet skeptický, ale zároveň zdravý pohled na AI.
Pop
https://www.technologyreview.com/2020/02/25/906083/artificial-intelligence-destroy-civilization-canaries-robot-overlords-take-over-world-ai/ – Jak poznat, že se AI chystá zničit svět?
https://www.technologyreview.com/2020/04/02/998478/ai-machine-learning-social-outcome-prediction-study – Lidská budoucnost je v současnosti stále nepredikovatelná.
https://algorithmwatch.org/en/story/google-vision-racism/ – Google vision vracelo tagy, které byly považovány za rasistické. Tohle téma bude u ML modelů častější a častější.
Vzdělávání
https://medium.com/dataseries/the-top-courses-to-pursue-during-the-lockdown-3ae469f2eec9 – Přehled online AI/ML related kurzů, které jsou dostupné zdarma, tak se inspirujte! (rcmd by reader)
https://www.kdnuggets.com/2020/04/hyperparameter-tuning-python.html – Jak ladit hyperparametry ve třech jednoduchých krocích.
https://lionbridge.ai/articles/difference-between-cnn-and-rnn/ – Jaký je rozdíl mezi CNN a RNN?
Data & Data Mining
https://www.reddit.com/r/MachineLearning/comments/g18xad/im_the_lead_researcher_at_waymo_and_im_here_to/ – Drago Anguelov, Principal Scientist a Head of Research ve Waymo, na redditu odpovídá na otázky ostatních uživatelů ohledně Waymo Open Dataset.
https://datasetsearch.research.google.com/ – Google vytvořil online vyhledávač datasetů.
https://blog.rstudio.com/2020/04/08/great-looking-tables-gt-0-2/ – Pojem, který všichni Rkaři znají, je grammar of graphics – strukturované principy tvorby vizualizací, využité v balíčku ggplot2. Balíček gt se snaží tento přístup replikovat při tvorbě tabulek (grammar of tables). Jeho tvůrce Riche Iannona si můžete poslechnout v podcastu the r podcast zde. (rcmd by reader)
Video & podcast
https://www.youtube.com/watch?v=pbGq3REp4PI&fbclid=IwAR0Ro91sjbHIJEHQrZbCewkTj_bzBfCwRg9N_ZzYAe3yfb2sRW_QtJSnVTk – Moskva má program Safe City, který využívá 178 000 kamer umožňujících rozpoznávání obličeje. (rcmd by reader)
Odborné články
https://mml-book.github.io/ – Zdarma dostupná učebnice matematiky pro ML.
https://arxiv.org/pdf/2003.07082v1.pdf – Stanza, oficiální NLP toolkit od Stanfordu pro Python, který umí 66 jazyků. Zde najdete kód a dokumentaci.
Za ohradou
https://amfam.wd1.myworkdayjobs.com/en-US/AmericanFamilyConnectPropertyCasualtyInsuranceCompany/job/AH-WI-De-Pere-IDS-Prop–Cas-Ins/Data-Scientist_R15660 – Data Scientist v Connectu, v Chicago, USA.
Vtip
https://9gag.com/gag/a7w4PGw?fbclid=IwAR1mgBtsRsmAtAqywQQvlKlmNoWsQHkX8BFBUUB3WLRyqXPzRzQw3pDx9J8 (rcmd by reader)
Be First to Comment