5 pagrindiniai duomenų mokslo ir mašinų mokymosi šaltiniai

Duomenys yra naujoji alyva. O mašinų mokymasis yra ugnis. Kas valdo šiuos du, tas valdys pasaulį.


Ne, aukščiau išdėstyta nėra kažkokia pompastiška frazė, paimta iš distopinio romano.

Tai tikrovė.

Naujosios pasaulio tvarkos tikslas yra surinkti didžiulį kiekį svarbių duomenų ir juos apdoroti įgyvendinamomis įžvalgomis – to žmonijos istorijoje nepavyko padaryti. Tai yra tokia technologija, kuri leidžia šaliai patekti į priekį iš kitų ir galiausiai valdo pasaulį. Dėl to progresyvios pasaulio tautos į tai žiūri labai rimtai.

Pelningas karjeros pasirinkimas

Tarptautinės intrigos, duomenų mokslas ir mašinų mokymasis yra nauja nauja sritis, turinti neįtikėtiną galimybę. Paklausa nėra (to švelniai tariant), o duomenų mokslininkų nėra pakankamai. Net ne vidutiniškai.

Panašu, kad staiga atradome daug naujų apgyvendinamų planetų ir nėra pakankamai žmonių, kad galėtų jas perkelti. Galėčiau tęsti ir skambėti kaip sugedęs įrašas, bet aš manau, kad ši infografika daro šį darbą daug geriau:

Šaltinis: insidebigdata.com

Taigi matome, kad atlyginimai prasideda nuo 50 000 USD +, o vadovai gali šaudyti gerokai virš 250 000 USD.

Ir ne tik tai, kad iki 2020 m. Vidutinis šios planetos žmogus sugeneruos 1,7 MB duomenų per sekundę. Tai yra daugiau nei 3500 TB duomenų per visą gyvavimo laiką – daugiau duomenų, nei mes žinome, kaip dabar tvarkyti, jau nekalbant apie naudojimą analizei. Pasakyti, kad ateitis yra šviesi, reikštų prasimanymą šiai nuostabiai naujai ganyklai.

Ar sunku duomenų mokslui ir mašinų mokymuisi?

Geras klausimas!

Iš mano patirties atsakymas yra „taip“ ir „ne“.

Dirbtinis intelektas (ir, kalbant, mašininis mokymasis) yra sunkiausias dalykas, kurį reikia padaryti, jei esate linkęs gilintis į tyrimus ir stumti voką. Už tokį darbą net daktaras kompiuterių ir matematikos mokslų nepakanka. Bet tada paprastas žmogus neturi nei ambicijų, nei laiko tokiam užsiėmimui.

Kita vertus, aš vadinčiau taikomuosius duomenų mokslus ir mašinų mokymąsi.

Tai yra, jūs paimsite esamus įrankius, metodus ir algoritmus ir pritaikysite juos kai kurioms realaus pasaulio problemoms išspręsti. Ši dalis reikalauja atsidavimo, suvokimo ir kūrybinio mąstymo (ir žinių apie kai kurias paprastas matematikos sąvokas, kurios greitai išmokstamos), tačiau, kalbant apie tikras „technines“ žinias, yra daug švelnesnės nei tai, ką vadina programinės įrangos inžinieriaus darbas.

Kitaip tariant, tai nėra takas, o eisena atlygio ir pastangų santykis, yra viena geriausių investicijų ten.

Dabar, kai užgriuvote ryžtą tapti duomenų mokslininku ir mašinų mokymosi inžinieriumi, pradėkime ieškoti geriausių galimybių.

„Machine Learning Crash Course“ („Google“)

Nedaug žmonių žino, bet „Google“ turi platų, labai praktišką ir nemokamas mašinų mokymosi kursas. Anot bendrovės, tai yra dalis jų įsipareigojimo tobulinti AI / ML technologijas ir išlaikyti žinias atviroje vietoje.

Geriausias dalykas šiame kurse yra tas, kad nėra jokių būtinų sąlygų, tačiau stenkitės skirti daugiau laiko savarankiškai tyrinėti statistikos sąvokas.

Aš turiu omenyje, kad tai nereikalinga, bet jei neturite nulio fono išplėstinėje statistikoje, paaiškinimų šiame kurse gali nepakakti. Kitas privalumas yra tas, kad šis kursas pristato mašinų mokymąsi per „TensorFlow“, kuris yra „Google“ sukurtas ML įgyvendinimas. Taigi tam tikra prasme „Google“ siekia reklamuoti savo mašinų mokymosi API, tačiau atsižvelgiant į šio kurso teikiamą vertę, aš nematau, kaip tai turėtų būti kliūtis.

Jei kas, „TensorFlow“ yra vienas iš lengvų būdų įsitvirtinti ML ir pasižymi nepaprastu populiarumu (AI struktūrų palyginimą skaitykite čia).

CS109 duomenų mokslas (Harvardo universitetas)

Pavadinimas Harvardas įkvepia baimė ir šis kursas.

Pirmiausia reikia pasakyti, kad tai nėra greitas, greitai praleidžiamas kursas, kuriame jūs patariate apie mašinų mokymąsi rašydami čia fragmentą arba scenarijų. Šis kursas yra sunkus ugnies krikštas, reikalaujantis sunkaus darbo ir didelių laiko sąnaudų.

Kursas pateikiami su nemokamais vaizdo įrašais, kodu (priglobtu „GitHub“) ir laboratorinių pratimų sprendimais, todėl praktiškai jūs nieko nevaržote, jei norite jį atlikti.

Ideali auditorija?

Tu … aš nejuokauju.

Aš sakyčiau, dirbantys profesionalai, turintys neblogą matematikos išsilavinimą, net jei jie jau nebėra mokantys matematikos (įpratimo įpročiai ir įrodymas yra būtiniausias dalykas). Bet dar kartą prašau perspėti: galite pamanyti, kad esate geras, tačiau šis kursas jausis lyg užkietėjus nagams pusryčiams – praktikos problemos yra pakankamai sunkios, kad verktų verkti, bet tada būtent tai gali būti dalykas vėl ieškote!

Mašinų mokymasis (Andrew Ng)

Eikite į barą, užpildytą duomenų mokslininkais, ir paklauskite, kas yra Andrew Ng, ir jūs sužinosite apie savo gyvenimą.

Duomenų mokslo ir mašininio mokymosi srityse Andrew Ng pasiekė dievišką statusą dėka savo išskirtinio kurso „Coursera“ – Mašinų mokymasis.

Ir jei abejojate Andrew Ng įgaliojimais, leisiu tai kalbėti pats už save:

Tai yra mokamas kursas, nes jis yra „Coursera“ kainų plano dalis, tačiau finansiniai įsipareigojimai ir ryžtas nėra vienintelės būtinos sąlygos. Tai yra ilgas kursas, nes Andrius gilinasi į visų dalykų ML matematiką ir išskiria populiarius algoritmus. Bet laimei, tai baigtas kursas, ir jūs būsite žingsnis po žingsnio vedami į tamsiausias gelmes ir sugrąžinsite atgal.

Labai rekomenduojama, daugiausia dėl to, kad šiandien reikia įgyti žinių apie šio kurso baigimo pažymėjimą!

Taikomasis duomenų mokslas su „Python“

„Coursera“ specializacijas sudaro kursų serija, kurios tikslas – nustoti jus nuo nulio iki tam tikros sąvokos žinojimo. Jei ieškote išsamaus, rimto, bet draugiško duomenų apie mokslą ir mašinų mokymosi su „Python“ kurso, aš negaliu to rekomenduoti specializacija pakankamai.

Kurso pabaigoje jūs uždirbate pažymėjimą.

Praktinis gilus kodų mokymasis

Šis kursas yra palaima ir yra mano mėgstamiausia rekomendacija šiame sąraše, jei esate koderis.

Aš dar kartą sakyčiau: jei esi koderis.

Taip yra todėl, kad šis kursas neišleidžia laiko išmokyti programavimo pagrindų. Kurso aprašyme tai pasakyta labai aiškiai (pabrėžiama originaliai):

Manome, kad visi, besimokantys šiame kurse, turi bent vienerių metų kodavimo patirtis. Kursuose mokymo kalba naudojama python, taigi, jei dar nežinote python, mes manome, kad praleisite laiką mokymuisi – patyrusiam programuotojui turėtumėte suprasti, kad python yra gana lengva išmokti kalbą..

Taigi, jei jūs jau žinote Python (jei ne mokykis čia), arba gali patogiai jaustis patogiai, tai yra puikus kursas praktikams, norintiems sukurti tikras, tinkamas naudoti sistemas, per daug nesijaudinant dėl ​​algoritmų teorinių pagrindų..

Aš net galėčiau pasakyti, kad tai nekantriems mąstytojams (tokiems kaip aš!), Kurie nekenčia ceremonijos ir monotonijos.

O, ar aš paminėjau, kad jis yra 100% nemokamas ir turi puikią bendruomenę?!

Išvada

Phew!

Tai buvo sunkus sąrašas. Ne todėl, kad nebuvo pakankamai gerų šaltinių, bet todėl, kad jų buvo per daug!

Mašinų mokymasis yra sritis, kuri pažodžiui sprogo ir tikrai elegantiškai išsprendžia sunkias problemas, todėl jų yra šimtai kursų internete, nemokama ir mokama, dauguma jų yra tikrai geri. Bet tai taip pat gali sukelti painiavą, todėl aš bandžiau ją sumažinti iki penkių skirtingų tipų besimokantiesiems pagal jų patirties lygį.

Tikiuosi, kad tai padėjo!

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map