Kodėl už didelių duomenų ateities ir didžiulių pinigų

<

Kai ieškojau įdomių papildomų pajamų, kurios vėliau galėjo tapti pagrindinėmis, pasirinkimas buvo akivaizdus - IT rinka. Pradedantiesiems, vienintelė galimybė patekti per tam tikrą laiką yra laikas pereiti į išvykstamąjį traukinį. Santykinai nauja ir sparčiai besivystanti pramonė, kurios daugelis prognozuoja laimingą ateitį, yra dideli duomenys arba dideli duomenys. Kaip išmokti dirbti su jais, kodėl tai yra reikalinga ir kokių pažadų - šiandien pasidalinsiu su jumis savo patirtimi.

Dabar ne devyniasdešimtųjų metų ar net nulio pradžia, kai IT buvo įmanoma pasirinkti bet kurią profesiją ir pasiekti sėkmę. Rinka yra pernelyg prisotinta su specialistais, ir nėra jokios priežasties pradėti akivaizdžiai prarasti pasivyti padėtį. Po kelių naktų sėdėjimo internete ir kruopščiai išnagrinėjus visas atsirandančias IT tendencijas, nusprendžiau sutelkti dėmesį į didelius duomenis. Tai gana jauna technologija, kuri ateityje laikoma labai perspektyvia ir paklausa, o svarbiausia - tai tik pradeda tikėtis. Su mintimi „Taip, čia yra!“ Nuėjau suprasti, apie ką kalbama.

Kas yra dideli duomenys

Išraiškos „dideli duomenys“ išgirdo visi, tačiau tik nedaugelis į ją įtraukė teisingą reikšmę. Iš tiesų didelių duomenų sąvoka apima ne tik informacijos kiekį, bet ir jos apdorojimo technologiją, taip pat analizės metodus, kuriems viskas pradedama.

Svarbus dalykas yra tai, kad ne tik daug informacijos: jos apimtis nuolat auga ir sparčiai auga, o duomenys dažnai yra nestruktūriniai ir nevienalyčiai. Tai apima tekstus, vaizdus, ​​įvairiausius statistinius duomenis: nuo nešiojamų dalykėlių liudijimų ir vaizdo stebėjimo kamerų įrašų iki vartotojų veiksmų socialiniuose tinkluose. Apskritai duomenys gali būti nieko.

Nuo informacijos srauto, kuris yra visiškai beprasmis, iš pirmo žvilgsnio galima ne tik gauti naudingos informacijos, bet ir numatyti būsimus įvykius ar jų pasikeitimus. Tai yra laikoma pagrindiniu didelių duomenų turtu, kurio dėka jie gali būti taikomi bet kurioje mūsų gyvenimo srityje.

Kaip pavyzdį galime prisiminti „Google“ tyrimus, kurie 2009 m. Bandė numatyti gripo pandemijos plitimą vartotojų paieškos užklausų istorijoje, o „Microsoft“, kuri 2013 m. Galėjo identifikuoti narkotikų šalutinius poveikius atitinkamose medicinos institucijose.

Kam reikalingi dideli duomenys ir kodėl

Medicina ir mokslas yra pirmieji, kurie galvoja apie didelių duomenų naudojimą, tačiau nerealu, kad žmogus iš gatvės patektų į bet kokį mokslinių tyrimų projektą, o tai reiškia, kad reikia ieškoti daugiau masyvių ir komerciškai naudingų sričių. Laimei, versle ir rinkodaroje didelių duomenų poreikis yra ne mažesnis. Jie yra tiesiogiai susiję su pelnu, o už jų analizę moka labai geri pinigai.

Gebėjimas prognozuoti žmogaus įvykius ar elgesį su dideliais duomenimis yra šventas rinkodaros gralas.

Nežinant, vartotojai susidaro daug informacijos, kuri, tinkamai apdorojant ir analizuojant, virsta galinga įtakos priemone. Tokiu būdu verslo savininkai gali sutaupyti reklamos, ją nukreipti tik į tikslinę auditoriją, žiniasklaida gali pasiūlyti vartotojams dominančią turinį, o parduotuvės padidins pardavimus, skatindamos susijusių produktų pirkėjus.

Iki šiol į tai atėjo tik nedaugelis. Paradoksas yra tai, kad duomenų kiekis jau yra sukauptas ir nuolat auga, tačiau yra labai mažai specialistų, kurie galėtų juos analizuoti ir gauti vertingos informacijos iš netvarkingos masės. Tai atlieka mūsų rankas, nes galima išmokti analizuoti didelius duomenis.

Kaip tapti dideliu duomenų specialistu

Jei neturite šešių laisvų metų studijuoti universitete (ir aš jų neturiu), tada yra tik vienas išeitis: intensyvūs kursai. „Google“ išdavė užklausą „didelių duomenų mokymas Maskvoje“ paskatino mane į mokymo projektą „Naujos profesijos laboratorija“, kur jau vyksta penktasis „Big Data Specialist“ kursų rinkinys.

Man nepatinka teorija ir visada laukiu praktinių pamokų, todėl mane traukia nestandartinė mokymo programa, kurios dėmesys nukreiptas į praktiką. Sutinku, tai yra daug maloniau išspręsti realias problemas iš gyvenimo, o ne nuobodų vadovėlių pavyzdžių.

Ką išmokti

Tris mėnesius mokytojai, turintys patirties didelėse įmonėse, naudos realaus gyvenimo pavyzdžius, kad išmokytų mus išspręsti dažniausiai pasitaikančias didelio duomenų pasaulio užduotis. Mokymas suskirstytas į du etapus: dirbti su duomenimis ir dirbti su rekomendacinėmis sistemomis.

Pirmame modulyje išsamiai aptariami įvykių sekimo ir žmonių elgesio internete algoritmai. Pasirodo, kad su savo pagalba galite stebėti apie 2000 savybių, tarp kurių, be banalios lyties ir amžiaus, yra asmeniniai interesai, šeimyninė padėtis ir daug daugiau.

Antrasis modulis skirtas rekomendacinėms sistemoms, kurios yra svarbi didelių duomenų dalis. Mes nepastebime, bet jie supa mus visur. Socialiniai tinklai siūlo draugams, internetinės parduotuvės pataria susijusiems produktams, o muzikos paslaugos siūlo naujus menininkus. Tikroji nauda žmonėms, kurie atrodo iš magijos iš išorės, iš tikrųjų yra sunkaus darbo ir mašinų mokymosi rezultatas.

Visa kursų programa su visų pamokų aprašymu yra šiek tiek bauginanti jo apimčiai: galų gale, jums reikės išmokti labai, labai daug. Tačiau, atsižvelgiant į tai, kad teorijai pridedama daug praktinių pratimų, viskas nėra taip baisu.

Vos per tris mėnesius turime atlikti 12 laboratorinių darbų, kurių kiekvienas yra pagrįstas realaus gyvenimo užduotimis.

Nuo paprastų iki sudėtingų mokytojų mokys viską, kas gali būti reikalinga darbe, ir namų darbų pagalba patikrins, kaip gerai mokoma medžiaga.

Tiesiog reikia sureguliuoti rimtą darbą. Tris kartus per savaitę tris valandas. Be to, turite rasti laiko laboratoriniams darbams atlikti ir pakartoti medžiagą. Intensyvus skirtas ne tik internetinėms, bet ir internetinėms klasėms, todėl jis yra prieinamas ne tik maskviečiams.

Man svarbu, kad šie kursai nebūtų jokios dviejų savaičių trukmės kursai, kuriems būtų suteiktas nenaudingas sertifikatas. Intensyvi programa skirta suteikti absolventams pirminę patirtį sprendžiant įvairias užduotis ir suteikiant žinių, kurios padės susidoroti su kylančiomis problemomis ir ugdyti įgūdžius.

Kaip pradėti ir ką jums reikia

Kitas kursas prasideda spalio 5 d., Bet dabar galite užsiregistruoti. Likusį laiką iki pradžios galima naudoti norint pagerinti savo žinias, nes auditorijai reikia šiek tiek patirties IT srityje.

Būtinai žinokite „Python“ ar kitą aukšto lygio programavimo kalbą, galėsite dirbti su „SQL“ ir naršyti „Linux“. Taip pat labai sveikintinas statistikos ir tikimybių teorijos supratimas. Tiems, kuriems reikia tik atnaujinti šias žinias, prieš pradedant pagrindinį kursą bus intensyviai vykdoma Python, Linux ir matematinė statistika.

Jei jūs, kaip ir aš, nesate labai stiprūs, tai dabar geriau atsisėsti studijuoti, nes po kurso pradžios jūs greičiausiai neturėsite laisvo laiko, be žinios apie pagrindus, mokymasis neveiks. Apie tai naujose profesijose Lab sąžiningai įspėjau.


Iš pirmo žvilgsnio dideli duomenys gali atrodyti sudėtingi, o mokymosi procesas yra daug laiko, tačiau žaidimas yra verta. Tai puiki proga tapti patraukliu pelningo ir dar neapimtos rinkos specialistu. Man reikia pasakyti, kad nuodėmė nėra ją naudoti?

Na, kol atnaujinu Python žinias savo atmintyje, tyriu statistiką ir laukiu rudens.

Prašyti dalyvauti intensyviai

<

Populiarios Temos