Ahoj,
je pátek a číslo 100 je tady! Připravil jsem pro Vás speciál, takže krom tradiční nálože článků, si můžete projít i nějaké ty informace, které jsem o DSB nasbíral.
S narozeninami se chystá i jedna velká změna! Protože poptávka ze zahraničí sílí, tak od příštího dílu bude DSB nově v angličtině a bude mít mezinárodní publikum.
Na závěr chci poděkovat všem, co mě v tom nenechávají samotného a svému zaměstnavateli, že mě v tom přímo podporuje.
Dost bylo úvodu, jako vždy, užijte si čtení!
(pod přílohou je klasicky bulletin)
Příloha
Víte, že:
- DSB poprvé pro ostatní vyšlo ve středu 3. 5. 2017 v 8:28
- první DSB obsahovalo 5 odkazů a mělo 6 odběratelů
- už předtím existovaly asi dvě „čísla“, která jsem si dělal sám pro sebe, což byla a stále je původní motivace, mít kontakt s tím, co se děje v data science světě
- inspirací pro vznik DSB byl český videoherní vidcast Vortex
- název data science bulletin vznikl při čtení papírového odborářského bulletinu 🙂
- v druhém čísle byly poprvé odkazy rozdělené do kategorií a poprvé byl součástí i vtip
- číslování jednotlivých dílů začalo od DSB #7
- od čísla 9 byl počet odkazů na každou kategorii omezen na tři články
- původně byl DSB týdenní občasník, od čísla 75 je z něj dvoutýdenní občasník
- sestavit jeden díl trvá 3 až 6 hodin v závislosti na množství doporučených článků a úrodě kvalitních článků ve zdrojích
- celkem bylo v bulletinu 2 145 různorodých článků a stránek (cca 21 článků na díl), z toho jste doporučili minimálně 794 článků přímo Vy!
Zdroje:
- obsah do DSB by neexistoval bez těchto newsletterů, které fungují jako zdroj, a zároveň je můžu s klidem doporučit:
- ScienceDaily: Computers & Math News (https://www.sciencedaily.com/news/computers_math/)
- Center for Data Innovation (https://www.datainnovation.org/)
- Analytics Dispatch (https://mode.com/analytics-dispatch/)
- Normcore Tech (https://vicki.substack.com/)
- Data Science Weekly (https://www.datascienceweekly.org/)
- Data Science Roundup by Tristan Handy (http://roundup.fishtownanalytics.com/)
- MIT Weekly (https://www.mit.edu/mit-daily-weekly/)
- KDnuggets (https://www.kdnuggets.com/)
- insideBIGDATA (https://insidebigdata.com/)
- Quanta Magazine (https://www.quantamagazine.org/)
- FinTech Weekly (https://fintechweekly.com/)
- Artificial Intelligence Weekly (http://aiweekly.co/)
- Data Elixir (https://dataelixir.com/) – Druhý nejlepší newsletter v tomhle seznamu, a aktuálně ten nejlepší z těch, co pořád fungují.
- PyCoder’s Weekly (https://pycoders.com/)
- Import AI (https://jack-clark.net/)
- Analytics Vidhya (https://www.analyticsvidhya.com/blog/)
- Data Machina (https://datamachina.substack.com/) – Tohle byl nejlepší newsletter ever, ale bohužel umřel. Hardcore technický, spousta cool analýz.
Weby
- No a bez stránek se články by to samozřejmě nešlo. Dole najdete jaké weby má DSB nejradši, aneb počet výskytů. Je to očištěné na úroveň domény druhého řádu, ze které se započítávají jenom klíčová slova (arbitrárně určená).
- github: 135
- medium: 125
- kdnuggets: 96
- towardsdatascience: 71
- youtube: 60
- analyticsvidhya: 53
- arxiv: 51
- technologyreview: 30
- nytimes: 24
- insidebigdata: 23
- forbes: 20
- quantamagazine: 19
- thefinancialbrand: 19
- google: 18
- realpython: 17
- devhumor: 16
- wired: 16
- hackernoon: 15
- ihned: 13
- googleblog: 12
- techcrunch: 12
- xkcd: 12
- linkedin: 11
- irozhlas: 11
- idnes: 11
- theverge: 10
- cnbc: 10
- theguardian: 10
- fast: 10
- bloomberg: 10
Ostatní
- zbytek DSB tvoří tento text (odstraněny některá stopwords a slova kratší než 4 znaky):
Kdy DSB vycházel?
Největší pauza byla u čísla 72 (květen 2019), na které se muselo čekat 37 dní. Jak dlouho se na jednotlivá čísla čekalo, můžete vidět zde:
DSB | Čekačka |
---|---|
#1 | 0 days |
#2 | 9 days |
#3 | 7 days |
#4 | 7 days |
#5 | 7 days |
#6 | 7 days |
#7 | 7 days |
#8 | 5 days |
#9 | 9 days |
#10 | 21 days |
#11 | 7 days |
#12 | 7 days |
#13 | 7 days |
#14 | 7 days |
#15 | 7 days |
#16 | 6 days |
#17 | 8 days |
#18 | 10 days |
#19 | 11 days |
#20 | 14 days |
#21 | 7 days |
#22 | 10 days |
#23 | 11 days |
#24 | 6 days |
#25 | 8 days |
#26 | 7 days |
#27 | 14 days |
#28 | 24 days |
#29 | 11 days |
#30 | 7 days |
#31 | 7 days |
#32 | 14 days |
#33 | 14 days |
#34 | 7 days |
#35 | 7 days |
#36 | 13 days |
#37 | 8 days |
#38 | 7 days |
#39 | 7 days |
#40 | 7 days |
#41 | 7 days |
#42 | 14 days |
#43 | 14 days |
#44 | 21 days |
#45 | 7 days |
#46 | 21 days |
#47 | 7 days |
#48 | 7 days |
#49 | 7 days |
#50 | 7 days |
#51 | 7 days |
#52 | 7 days |
#53 | 7 days |
#54 | 7 days |
#55 | 7 days |
#56 | 6 days |
#57 | 8 days |
#58 | 7 days |
#59 | 7 days |
#60 | 14 days |
#61 | 14 days |
#62 | 14 days |
#63 | 14 days |
#64 | 21 days |
#65 | 21 days |
#66 | 7 days |
#67 | 14 days |
#68 | 21 days |
#69 | 7 days |
#70 | 14 days |
#71 | 19 days |
#72 | 37 days |
#73 | 7 days |
#74 | 31 days |
#75 | 14 days |
#76 | 11 days |
#77 | 14 days |
#78 | 14 days |
#79 | 14 days |
#80 | 21 days |
#81 | 14 days |
#82 | 14 days |
#83 | 14 days |
#84 | 14 days |
#85 | 14 days |
#86 | 27 days |
#87 | 8 days |
#88 | 14 days |
#89 | 14 days |
#90 | 14 days |
#91 | 17 days |
#92 | 11 days |
#93 | 14 days |
#94 | 16 days |
#95 | 29 days |
#96 | 11 days |
#97 | 14 days |
#98 | 21 days |
#99 | 14 days |
Jak se vyvíjel počet čtenářů?
- na ose x je vidět, jak se prodloužila doba mezi každými čísly
DSB
Analytické
https://towardsdatascience.com/announcing-pycaret-2-0-39c11014540e – Venku je knihovna pro ML v pythonu, PyCaret 2.0. Co přináší, se dozvíte v odkazu. (rcmd by reader)
https://multithreaded.stitchfix.com/blog/2020/08/05/bandits/ – Jak ve Stitch Fix implementují Multi-Armed Bandits.
https://blog.exxactcorp.com/what-can-you-do-with-the-openai-gpt-3-language-model/ – GPT-3 je možná největší událost v NLP v poslední době, takže doporučuji i tento článek, který Vám vysvětlí, proč je to tak přelomové.
Computer Science & Science
https://ericlippert.com/2014/03/05/how-to-debug-small-programs/amp/ – Stručný a užitečný návod, jak debugovat malé programy. (rcmd by reader)
https://jesseduffield.com/beginners-guide-to-abstraction/ – Jak na abstrakci, kdy ano a kdy ne. Aneb DRY princip neplatí vždy. (rcmd by reader)
https://eigenfoo.xyz/floating-point-deep-learning/ – Floating point je v computer science velká věc, v článku se dozvíte, proč hraje roli i v data science.
Grafy a vizualizace
https://programmerbackpack.com/python-knowledge-graph-understanding-semantic-relationships/ – Knowledge graph v pythonu – hezký tutoriál. (rcmd by reader)
https://aws.amazon.com/builders-library/building-dashboards-for-operational-visibility/ – Články o dashboardech jsou hodně podněcované, ale v tomhle Vám Amazon vysvětlí, jak na dashboardy pro monitoring.
Business a kariéra
https://a16z.com/2020/08/12/taming-the-tail-adventures-in-improving-ai-economics/ – Rozsáhlý, hodně analytický a napříč internetem sdílený článek o úskalích a vlastnostech AI businessu.
https://hex.tech/blog/data-team-roi – Jak (ne)počítat ROI (return on investment) u data science týmu.
https://www.kdnuggets.com/2020/08/data-scientist-job-market-2020.html – Jak vypadá pracovní trh s data scientisty v USA v roce 2020, jaké jsou současné trendy. S tím souvisí i tento článek, který hezky popisuje, na co by se měl člověk zaměřit, pokud chce práci v oboru.
Pop
https://blog.kamil-zmeskal.cz/2020/08/budoucnost-vyuzivani-rodnych-cisel.html?m=1 – Budoucnost rodných čísel. (rcmd by reader)
https://www.armadninoviny.cz/clovek-vs-umela-inteligence-roboticke-a-lidske-f-16.html – Nepřekvapivě AI proniká i do armádních technologií jako je třeba F-16. Budeme mít robotické stíhačky? (rcmd by reader)
https://www.theguardian.com/world/2020/aug/10/government-paid-vote-leave-ai-firm-to-analyse-uk-citizens-tweets – Britská vláda platila soukromou firmu za analýzu twitterových příspěvků britských občanů v souvislosti s koronou.
Vzdělávání
https://johnlekberg.com/blog/2020-08-01-task-order.html – Procvičte si algoritmizaci a vyzkoušejte si Kahnův algoritmus, uvedená úloha má napsané řešení v pythonu. (rcmd by reader)
https://www.amazon.science/latest-news/machine-learning-course-free-online-from-amazon-machine-learning-university – Amazon nabízí veřejnosti svoji ML universitu.
https://www.kdnuggets.com/2020/08/unit-test-data-pipeline-thank-yourself-later.html – Jednoduchý unit-testing pro data science pipelinu.
Data & Data Mining
https://medium.com/@angebassa/data-alone-isnt-ground-truth-9e733079dfd4 – Neberte data jako danou věc, ani když potvrzují Vaši hypotézu, buďte skeptičtí a zkoumejte je. (rcmd by reader)
https://www.sankalpjonna.com/posts/handling-more-than-200-transactions-per-second-using-python-rq – Jak s Pythonem zvládnout 200 api transakcí za vteřinu. (rcmd by reader)
https://analyticsindiamag.com/top-10-javascript-machine-learning-libraries/ – I JavaScript má své knihovny pro machine learning, tady je top 10 podle autora článku. (rcmd by reader)
Video & podcast
https://www.youtube.com/watch?v=i7yoXqlg48M – Dobrá přednáška na základy Dockeru. (rcmd by reader)
https://www.youtube.com/watch?v=SnCi0s0e4Io&feature=youtu.be – V DSB #53 jsme zmínili knihovnu gganimate, která je už na CRANu, tak si dejte intro, jak na ni. (rcmd by reader)
https://www.youtube.com/watch?v=JMLsHI8aV0g – Čína používá AI ve výuce k trackování studentů, děsivé. (rcmd by reader)
Odborné články
https://syncedreview.com/2020/08/06/arxivs-1-7m-research-papers-now-available-on-kaggle/ – Všechny arXiv články jsou nyní dostupné na Kagglu. Najdete je zde.
https://www.youtube.com/watch?v=nv6oFDp6rNQ – V tomhle krátkém videu Vám autor vysvětlí paper o Hopfield Networks.
https://venturebeat.com/2020/08/10/researchers-find-inconsistent-benchmarking-across-3867-ai-research-papers/ – Neřešte papery, které se zabývají výkoností modelů, u většiny z nich to nemá smysl.
Za ohradou
https://careers.unity.com/position/senior-manager-machine-learning/2251894 – Senior ML manažer v Unity v San Fransiscu, USA.
Vtip
https://qph.fs.quoracdn.net/main-qimg-4974c85e10dde16939d8ad1b2104c629-c
Be First to Comment