Skip to content

DSB #99

Ahoj,

unavený pátek je potřeba rozproudit s pomocí DSB. Doporučuji úplně všechno, tenhle díl nemá slabý článek. Ale pokud něco stojí za Váš čas, tak si dejte video, které je jako první odkaz v kategorii Video & podcast. Perfektní záležitost.

Jako vždy, užijte si čtení.

Analytické

https://medium.com/@pierre_guillou/faster-than-training-from-scratch-fine-tuning-the-english-gpt-2-in-any-language-with-hugging-f2ec05c98787 – Dlouhý článek, jak natrénovat z GPT-2 model pro jiný jazyk. (rcmd by reader)

https://multithreaded.stitchfix.com/blog/2020/07/07/large-scale-experimentation/ – Jaké jsou opportunity costs u experimentů v data science, co je paradox of power a jak s tím může pomoci Bayes.

https://ammar-alyousfi.com/2020/youtube-trending-videos-analysis-2019-us – Dlouhá, ale zajímavá analýza videí na YouTube, které byly za rok 2019 v trendech v USA.

Computer Science & Science

https://makefiletutorial.com/ – Cheatsheet, který stručně představí makefiles a ukáže spoustu tipů a triků, jak je vytvářet. (rcmd by reader)

https://www.python.org/dev/peps/pep-0622/ – PEP 622, který do Pythonu přináší match statement, který umožní se vyhnout if/elif/elif/elif/elif peklu. (rcmd by reader)

https://www.quantamagazine.org/how-to-turn-a-quantum-computer-into-the-ultimate-randomness-generator-20190619/ – Všichni víme, že náhodnost je problematická a její generování není úplně easy. Tak si přečtěte, jak by se tohle mohlo změnit s nástupem kvantových počítačů.

Grafy a vizualizace

https://korpus.cz/mapka/ – Apka, která Vám přestaví různá nářečí v ČR včetně jejich ukázek a vývoje v čase. (rcmd by reader)

https://towardsdatascience.com/the-simplest-way-to-create-complex-visualizations-in-python-isnt-with-matplotlib-a5802f2dba92 – Nejjednodušší způsoby, jak vytvořit vizualizaci v Pythonu bez matplotlibu. (rcmd by reader)

https://towardsdatascience.com/sweetviz-automated-eda-in-python-a97e4cabacde – Pěkných nástrojů na EDA není moc, tak zkuste třeba knihovnu Sweetviz pro Python. (rcmd by reader)

Business a kariéra

https://medium.com/riskified-technology/how-we-choose-what-to-research-57acb835fdd7 – Jak si vybírají výzkumné projekty v Riskifiedu.

https://fortune.com/2020/07/15/bond-banking-products-goldman-sachs-startup-funding-fintech/Startup Bond vybral 32 miliónů dolarů pro svoji činnost. Tím je umožnit nebankovním společnostem nabízet bankovní služby (např. kreditky).

https://www.finextra.com/newsarticle/36215/hsbc-signs-multi-year-deal-with-amazon-web-servicesHSBC podepsalo s Amazonem smlouvu na několik let, která ji umožní využívat AWS technologie napříč svým bankovním businessem. BTW mají i dlouholetý kontrakt s Google Cloud.

Pop

https://www.theatlantic.com/ideas/archive/2020/07/why-covid-death-rate-down/613945/ – Počty nemocných s Covid-19 v USA roste, ale počet úmrtí stagnuje, tak si můžete přečíst hypotézy, proč tomu tak je a jaké jsou prognózy. Zde ještě stručný report o celosvětovém průběhu.

https://www.industrialempathy.com/posts/design-docs-at-google/ – Jak v Googlu připravují softwarové design dokumenty. (rcmd by reader)

https://robjhyndman.com/hyndsight/terminology-matters/ – Proč je odborná terminologie důležitá, respektive proč na ní záleží.

Vzdělávání

https://wiki.postgresql.org/wiki/Don’t_Do_This – Čemu se vyhnout v PostgreSQL (ze kterého vychází i Aster). Spoustu zajímavých tipů. (rcmd by reader)

https://explained.ai/rnn/index.html – Jak vysvětlit RNN a vyhnout se přitom neuronovým sítím a zaměřit se víc na vektorové transformace. Velmi rozsáhlý článek.

https://oatml.cs.ox.ac.uk/blog/2020/07/10/are-capsules-a-good-idea-a-generative-perspective.html – Capsule networks, jak fungují, ale i jaké jsou s nimi spojené komplikace.

Data & Data Mining

https://netflixtechblog.com/byte-down-making-netflixs-data-infrastructure-cost-effective-fee7b3235032 – Všude sdílený článek o tom, jak se snaží mít Netflix datovou infrastrukturu efektivní.

https://github.com/google-research/torchsde – torchsde je Pytorch implementace stochastických diferenciálních rovnic v Pythonu, podporující GPU.

https://github.com/Miserlou/Zappa – Zappa Vám umožní nasadit serverless aplikaci, a zároveň Vám nabídne infinite scaling, zero downtime a zero maintenance. (rcmd by reader)

Video & podcast

https://www.youtube.com/watch?v=6avJHaC3C2U&t=2431s – Poučná, zábavná a naprosto jedinečným způsobem vypointovaná přednáška o umění programovat, pohledu na digitální svět a programovacích jazycích. Krásně strávená hodina. (rcmd by reader)

https://www.youtube.com/watch?v=o9pEzgHorH0&feature=youtu.be&app=desktop – Nepište třídy (classes), když není třeba! Respektive jak se vyhnout overengineeringu. (rcmd by reader)

https://www.sciencemag.org/news/2020/07/watch-artificial-intelligence-learn-simulate-sloppy-mixtures-water-sand-and-goop – GNS (graph network based simulator) od DeepMind umí predikovat (simulovat) chování vody a písku. Moc pěkný.

Odborné články

https://arxiv.org/abs/2003.03384 – AutoML, aneb evoluční algoritmy vyvíjí ML modely a ML algoritmy. (rcmd by reader)

http://aima.cs.berkeley.edu/index.html – Právě vychází čtvrté vydání AI Bible – Artificial Intelligence: A Modern Approach. (rcmd by reader)

https://www.analyticsvidhya.com/blog/2020/07/top-business-analytics-books-to-read/ – Pokud nemáte co číst, tak koukněte sem. Některé ty knihy vypadají zajímavě.

Za ohradou

https://careers-grubhub.icims.com/jobs/10239/senior-data-scientist/job – Senior Data Scientist pro Grubhub v New Yorku, nebo v Chicagu, USA.

Vtip

https://pics.me.me/3×4-3×4-12-12479001600-12x11x10x9x8x7x6x5x4x3x21-479001600-12xi10x9x8x7x6x5x2x1x34-479001600-47900160o-479001600-45925097.png (rcmd by reader)

Be First to Comment

Leave a Reply