من چند سال است که به کارشناسان ارشد علوم داده آموزش می دهم و دانشمندان مشتاق داده را در یک بوت کمپ راهنمایی می کنم. کار با کسانی که سعی می کنند در این زمینه کار کنند بسیار عالی است - من می توانم در کنار آنها یاد بگیرم و به من کمک می کند توانایی خود را در توضیح ابزارهایی که روزمره کار می کنم توسعه دهم. همچنین تماشای پیشرفت افراد به عنوان دانشمندان تازه کار داده بسیار ارزشمند است.

در طول این سالها من دانش آموزان زیادی را دیده ام تا درک خوبی از موفقیت در آنها ایجاد کنند. منظور من از "موفقیت" در اینجا بسیار گسترده است - کسانی که از برنامه درسی علم داده ( سیلابس های رایج ) خارج می شوند و به دنبال یادگیری بیشتر هستند،  در موقعیت خوبی برای استخدام در صنعت علم داده قرار می گیرند.

این حس ارتباط کمی با فداکاری یا نوعی هوش خام دارد. همه اینها به مهارتهایی مربوط می شود که آنها آموزشهای خود را با آنها شروع می کنند.

بیایید به سرعت برخی از مهارت های فنی مورد نیاز دانشمند داده را از بینیم:

  • برنامه نویسی
  • آمار
  • فراگیری ماشین
  • تخصص های مختلف (به عنوان مثال ابزارهای کلان داده ، تجسم داده ها و غیره)

تسلط بر حداقل برخی از این مهارت ها برای هر دانشمند داده ضروری است. اما یکی در هنگام شروع بسیار مهمتر است.

آنچه دانشمندان مشتاق داده را متمایز می کند که خوب عمل می کنند و کسانی که تلاش می کنند بیشتر مهارت رمزگذاری است.

بیشتر سیلابس های موجود برای علوم داده شامل یادگیری چیزی به صورت انتزاعی - نظریه و ریاضیات پشت یک روش - و سپس فرصتی برای عملی کردن آن است. عملی کردن آن به معنای نوشتن کد است ، یا برای پیاده سازی آنچه آموخته اید یا استفاده از ابزاری که قبلاً آن را پیاده سازی کرده است. استفاده از این موارد در عمل به تقویت درک یک مفهوم کمک می کند.

اگر کدنویسی را جدی نمیگیرید مطمئن باشید که در یادگیری علم داده ضربه ی بزرگی خواهید خورد. یادگیری علم داده و کدنویسی ، دو چیز مجزا از هم ولی همزمان وابسته به هم هستند. اگر کد را نمی فهمید ، و آنچه را که اجرا می کند کاملاً کنترل نکنید ، نمی توانید از یک تمرین کدنویسی سود زیادی کسب کنید. شما نمی توانید داده های خود را به درستی کدنویسی کنید پس نمی توانید خروجی داده ی درستی داشته باشید

داشتن پایه و اساس در آمار نیز مهم است زیرا زمینه و درک بسیاری از مفاهیم یادگیری ماشین را فراهم می کند ، اما به نظر من به اندازه کدگذاری اساسی نیست.

در حالی که ریاضیات و آمار به سطح بالاتری از پیچیدگی کمک می کنند ، در پایین ، اکثر الگوریتم های یادگیری ماشین بسیار شهودی هستند. توصیف آنها به روشی که مشخص شود چرا کار می کنند دشوار نیست.

اگر می توانید دانش آموز را وادار کنید که شهود پشت یک الگوریتم را درک کند ، الگوریتم های برنامه نویسی می توانند برای یادگیری صبر کنند - اما اینکه بتوانید کدی را که از الگوریتم استفاده می کند بنویسید ، برای دریافت درک درستی از آن، حتما به کدنویسی به موازی الگوریتم نیاز دارید.

اگر نمی فهمید که با هیچ یک از ابزارهایی که استفاده می کنید چه اتفاقی می افتد ، قصد ندارید درک خود را از تئوری بهبود ببخشید.

من نمی خواهم به نظر برسد که ادعا می کنم مهارت های دیگر مهم نیستند. اما به نظر من کسی که می خواهد وارد علم داده شود باید الگوریتم و قبل از آن باید کدنویسی را بداند.

  با استفاده از یک رویکرد نظریه و عمل ، سایر موارد را می توان دنبال کرد. اما اگر دانشجویی با کد دست و پنجه نرم کند ، همه موارد دیگر نیز یک مبارزه خواهد بود.

اگر دوست داشتید به اشتراگ بگزارید