Skip to content

DSB #90

Ahoj,

pátek je v plné síle, a tak je na čase se vhrnout na DSB (a brzy i na víkend). Za sebe jsem hodně nadšený z gitexploreru (Computer Science & Science), a pak z příspěvku o pokusu reprodukovat 255 ML paperů v Odborných článcích. Nicméně je toho jako vždy mnohem víc, co stojí za Vaši pozornost.

Jako vždy, užijte si čtení.

Analytické

https://www.fast.ai/2020/02/13/fastai-A-Layered-API-for-Deep-Learning/ – fast.ai – přichází s novou (druhou) verzí svého deeplearning balíčku fastai pro python.

https://www.kdnuggets.com/2020/02/practical-hyperparameter-optimization.html – Hledáme hyperparametry – od random search po genetické algoritmy v Pythonu.

https://www.kdnuggets.com/2020/02/adversarial-validation-overview.html – Adversarial validation, jak Vám může pomoci při trénování modelu – včetně kódu v Pythonu.

Computer Science & Science

https://gitexplorer.com/ – Tohle je tool roku. Už žádné tápání, jaký git příkaz použít. Otevřu gitexplorer a během pár chvil mám jasno. (rcmd by reader)

https://www.brandonsmith.ninja/blog/three-types-of-data – Autor popisuje tři typy data (constants, state a cached values), a proč je toto rozdělení užitečné.

https://towardsdatascience.com/tour-of-python-itertools-2af84db18a5e – Jak Vám itertools a more-itertools můžou ulehčit život v Pythonu.

Grafy a vizualizace

https://art42.net/?fbclid=IwAR3epl1b_ye_ENOhhO8Ndvm8EIYebnF03JT-dWPLDYR0UDlRqpJMxLVSU18 – Doslova moderní umění, vygenerujte si nekonečné množství originálních obrazů s pomocí neuronky. Bohužel jsem nedokázal dohledat žádný background info. (rcmd by reader)

https://github.com/thomasp85/patchwork – Potřebujete custom layout obrázků z ggplotu? Tak zkuste PATCHWORK. (rcmd by reader)

https://pair-code.github.io/interpretability/uncertainty-over-space/ – Tohle je neskutečný článek, který vizualizuje nejistotu modelu detekujícího rakovinu prostaty, a to v několika krocích. Must read pro lidi, které zajímá image recognition a computer vision.

Business a kariéra

http://www3.weforum.org/docs/WEF_Jobs_of_Tomorrow_2020.pdf – Světové ekonomické fórum vydalo nový report o zaměstnáních za právě probíhající čtvrté průmyslové revoluce. A jop, data science rules. (rcmd by reader)

https://dagblog.cz/velvoff-debriefieng-i-technologie-964b974643a1 – Jak se staví banka z nuly, když to vedou lidi, co rozumí modernímu vývoji, a zároveň neskočí na každý hype. (rcmd by reader)

https://www.forbes.com/sites/ronshevlin/2020/02/17/who-wants-a-marcus-checking-account/V minulém díle jste měli možnost se seznámit s digitální bankou Marcus od Goldman Sachs, která má nejenom velké ambice, ale i významný potenciál.

Pop

https://www.theverge.com/2020/2/6/21126637/white-house-trump-huawei-investment-ericsson-nokia-china-trade-war-william-barr – Čínský Huawei má v 5G sítích náskok a USA se to nelíbí, a to tak že hodně. Tak moc, že padají návrhy investovat do evropských konkurenčních společností. Trumpova administrativa se k tomu zatím staví odmítavě. (rcmd by reader)

https://techcrunch-com.cdn.ampproject.org/c/s/techcrunch.com/2020/02/06/deepnote-raises-3-8m-to-build-a-better-data-science-platform/amp/ – Deepnote vybral 3,8 mil. USD, aby přišel s kompletní cloud-based platformou, která hardware a infrastrukturu vyřeší za Vás. (rcmd by reader)

https://www.vice.com/en_in/article/jgedjb/the-first-use-of-deepfakes-in-indian-election-by-bjp – Indie je pravděpodobně první zemí, kde bylo použito deepfake video za účelem ovlivnění voleb.

Vzdělávání

https://rajatvd.github.io/NTK/ – Neural tangent kernel s jehož pomocí můžete víc porozumět gradient descent.

https://www.analyticsvidhya.com/blog/2020/02/mongodb-in-python-tutorial-for-beginners-using-pymongo/ – Tutoriál na MongoDB s PyMongo.

https://www.kdnuggets.com/2020/02/fourier-transformation-data-scientist.html – Hezky popsaná Fourierova transformace pro data science.

Data & Data Mining

https://github.com/sfirke/janitorJANITOR je knihovna do R, která vám naformátuje/vyčistí názvy sloupců tak, jak si budete přát. Easy. (rcmd by reader)

https://github.com/fstpackage/fst – FAST je balíček, který Vám několikanásobně zrychlí writing i reading dat v R. Pro představu, dosahuje rychlosti až několik GB/s. (rcmd by reader)

https://github.com/facebookresearch/LASER/tree/master/tasks/CCMatrix – Korpus 32,7 mld. unikátních vět od Facebooku.

Video & podcast

https://www.superdatascience.com/podcast/hadley-wickham-talks-integration-and-future-of-python-and-r – Jeden z R gigantů, Hadley Wickham, v podcastu mluví o integraci a budoucnosti R a Pythonu. (rcmd by reader)

http://podcasts.joerogan.net/podcasts/lex-fridman-3Joe Rogan a jeho podcast nemá v současnosti na netu konkurenci, ale krom zpěváků, herců, politiků, kulturistů a dalších si zve i programátory nebo naposledy Lexe Fridmana, který v MIT pracuje na AI. (rcmd by reader)

https://www.youtube.com/watch?v=RJZWL0SjhMI – Ernst & Young mají v ČR svůj podcast, který tvoří kluci z Brocastu. V posledním dílu přivítali Honzu Řeřicha – CFO startupu SpaceKnow, kde s pomocí neuronových sítí analyzují satelitní snímky. (rcmd by reader)

Odborné články

https://thegradient.pub/independently-reproducible-machine-learning/ – Článek o pokusu reprodukovat 255 ML paperů. U 62 % se to povedlo. Důležité info i pro nás, když se snažíme nějaký paper uvést v život.

Za ohradou

https://amerant.csod.com/ats/careersite/JobDetails.aspx?site=2&id=552 – Business Data Scientist, Miami, Florida, USA.

Vtip

https://i.redd.it/tl3fmvuqv1i31.jpg (rcmd by reader)

2 Comments

Leave a Reply