So erstellen Sie ein Data Science-Portfolio von Grund auf neu

Quelle: http://blog.whooosreading.org
Ich finde das sehr meta, weil ich darüber schreibe, wie ich ein Portfolio auf meinem Portfolio aufbauen kann.

Hallo Leser!

Willkommen zurück, ich hoffe, dass Sie nach dem Lesen einiger meiner Fallstudien ein paar Dinge erkannt haben, die ich hier versuchen möchte:

A. Präsentieren Sie meine Arbeit und meine Python- / Analysefähigkeiten
B. Präsentieren Sie meine Reise zum Erlernen von Python- / Analysefähigkeiten!

Vollständige Offenlegung, bevor ich mit diesem Artikel beginne: Ich bin ein Neuling im Bereich Data Science. Tatsächlich erfordert meine Arbeit im Moment nicht viel Datenwissenschaft, sondern eher grundlegende Analysen und Berichte. In den nächsten fünf Jahren versuche ich, mich voll und ganz in die Data Science als Karriere und in die Wissenschaft hineinzuversetzen.

Davon abgesehen möchte ich während dieser Vorbereitungszeit sicherstellen, dass meine erlernten Fähigkeiten in die Praxis umgesetzt werden. Sie sagen, Übung macht den Meister, und ich muss Ihnen nicht sagen, dass sie sich nicht irren! Um in diesem und jedem anderen Bereich voranzukommen, müssen Sie nur üben, üben, üben, um vom Anfänger über den Fortgeschrittenen zum Experten zu gelangen. Und denken Sie daran, sich nicht entmutigen zu lassen, weil:

Jeder Experte war einmal Anfänger - Helen Hayes

In meinem Fall möchte ich das Gefühl haben, dass meine Arbeit für etwas bestimmt ist. Ein Ziel, das ich zu erreichen versuche, oder etwas, das ich anzeigen kann, motiviert mich. Obwohl dies möglicherweise nicht jeden neuen Datenwissenschaftler motiviert, war nach einem Gespräch mit Branchenexperten (d. H. Beratern und Personen mit Doktortiteln auf diesem Gebiet, d. H. Superschlauen Mitarbeitern) immer ein Ratschlag üblich: Erstellen Sie ein Portfolio. Präsentieren Sie Ihre Arbeit irgendwo, denn Sie wissen nie, wer sie lesen wird, und möchten sich möglicherweise an Sie wenden.

Mein akademischer Hintergrund - Aufbau der Basis

Ich weiß vielleicht nicht viel über den Bau eines Hauses oder einer Art von Gebäude, aber ich weiß, dass es sehr wichtig ist, das Gebiet einzuschränken und eine Basis zu bauen, bevor ich mit einem Bauprojekt beginne. Das habe ich mit meiner Ausbildung gemacht. Ich habe einen Bachelor of Science in Biologie und Psychologie mit Auszeichnung. Sie wundern sich vielleicht - das hat nichts mit Data Science zu tun, wie ist das sinnvoll? Nun, das ist es wirklich. Das erste Grundstudium hat mir geholfen, ausgeprägte Fähigkeiten zum kritischen Denken, zum Forschen und vor allem zum Festhalten an der Wissenschaft und zu ihrer Liebe zu entwickeln. Ich war auch in der Lage, eine Vorliebe für das Gesundheitswesen und die öffentliche Gesundheit zu entwickeln und ein Anwalt für die öffentliche Gesundheit zu sein.

Nach meinem Bachelor-Abschluss habe ich mich eingeschrieben und absolviere derzeit ein Diplom in Data Science. Hier entsteht das Exoskelett des Hauses. Ich lerne Python, Statistik, konstruiere Modelle für maschinelles Lernen und gehe mit allen Arten von Daten um.

Wenn Sie derzeit ein Grundstudium oder ein postsekundäres Diplom absolvieren und das Gefühl haben, "Mann, das ist nutzlos, ich kann so viel mehr mit meinem Leben anfangen". Hören Sie nicht zu, was Social Media oder Social Media-„Prominente“ meinen Freunden sagen, eine Ausbildung ist wichtig! Wir bauen Fähigkeiten auf, von denen wir nicht einmal wissen, dass sie wir hatten, bis sie angewendet werden (höchstwahrscheinlich an Ihrem Arbeitsplatz oder in Ihrer Karriere).

Portfolio erstellen - Ihr Toolkit

  1. Mittlere und / oder andere Blogging-Plattformen

Diese Seite fühlt sich immer mehr wie zu Hause. Als ich mich für ein Portfolio entschied, überlegte ich, eine eigene Website auf einer Plattform wie WordPress oder Squarespace zu erstellen. Obwohl diese Plattformen erstaunlich sind, um Ihr eigenes Portfolio zu hosten, wollte ich einen Ort, an dem ich etwas Sichtbarkeit erhalte, und ein ziemlich gutes Tag-System, um ein größeres Publikum zu erreichen. Glücklicherweise hat Medium, wie wir wissen, diese Optionen (und sie sind auch kostenlos). Zuerst habe ich dafür gesorgt, dass auf dieser Website über Data Science und Analytics gesprochen und darüber geschrieben wurde - ich war offensichtlich nicht enttäuscht.

Nachdem ich mein Profil erstellt hatte, begann ich, meine erfolgreichen Aufgaben, die ich in meiner Zertifikatsklasse erledigt hatte, zu veröffentlichen. Langsam hoffe ich, dass dieser Blog eine Menge interessanter Fallstudien für die Leser sowie Artikel wie diese enthält. Artikel, die Menschen beim Navigieren in dieser Berufswahl helfen und faszinieren können.

Der einzige Nachteil von Medium ist, dass ich keine effizientere Möglichkeit gefunden habe, meine Jupyter-Notizbücher in Medium zu importieren, um meinen Code zu veröffentlichen. Das Posten von Code aus einer IDE kommt nicht in Frage! Im Moment schnippe ich einfach die Auswahl und poste sie als Bild in den Artikel. Ich bin mir allerdings sicher, dass es eine bessere Möglichkeit gibt, die JNs zu veröffentlichen - ich muss sie nur finden (und wenn ja, werde ich auf jeden Fall einen Beitrag dazu verfassen).

Andere Blogging-Plattformen, die Sie verwenden können: Wordpress und Squarespace, Tumblr (ich habe DS bei Tumblr noch nicht kennengelernt, aber es verfügt auch über Blogging-Fähigkeiten und eine große Anwenderbasis), für jeden Webentwickler können Sie natürlich… Ihre eigenen erstellen.

2. Kaggle

Kaggle war eine der ersten Sites, die mich wirklich zu Data Science gebracht haben. Wenn Sie Ihre Fähigkeiten wirklich zur Schau stellen möchten und die Leute Ihre Arbeit verehren möchten, können Sie das Tool Kaggle verwenden.

Die Teilnahme an Wettbewerben (und natürlich das Gewinnen), das Erstellen von Kernels aus Datensätzen und das Mitwirken an Diskussionen können dazu führen, dass jemand wirklich gesehen wird. Um Ihre Arbeit wirklich in den Vordergrund zu rücken, ist Kaggle meines Erachtens ein Muss in Ihrem Online-Toolkit.

Das Erstellen Ihres Kaggle-Profils kann ein Aspekt sein, den Sie in Ihren Lebenslauf aufnehmen, und Arbeitgeber können einfach Ihre Fähigkeiten überprüfen, indem sie Ihren Namen suchen. Sie können sehen, an wie vielen Wettbewerben Sie teilgenommen haben, welche Modelltypen Sie gebaut haben oder welche Analysen Sie möglicherweise mit den verfügbaren Datensätzen durchgeführt haben.

Ein weiterer Grund für Kaggle ist die Community. Ich fand, dass der Kaggle völlig frei von Urteilen und empfänglich für neue Lernende ist. Sie können Fragen stellen und von Studenten bis zu Experten eine durchdachte und ernsthafte Antwort erhalten. Wenn Sie etwas mehr Übung benötigen, können Sie zum Abschnitt Kaggle Learn gehen und das maschinelle Lernen und SQL überprüfen, oder wenn Sie sich in das Gebiet der R-Programmierung wagen möchten, können Sie dies auch tun. Es ist ein fantastisches Tool / eine fantastische Website, und ich fordere diejenigen auf, die es noch nicht ausprobiert haben, dies zu tun.

3. Github

Oh Github - Ich denke, Github ist DIE Codierungsseite. Sie möchten sicherstellen, dass Sie mindestens etwas dort haben. Obwohl ... zumindest für mich persönlich ... es ist auch eine der verwirrendsten Seiten! Ich bin ehrlich der Meinung, dass es in jedem Data Science- oder Coding-Kurs ein separates Modul geben sollte, in dem das Posten auf Github behandelt wird. Da Github die Hauptquelle ist, die fast alle Menschen in den Bereichen Informatik, Datenwissenschaft usw. verwenden, um ihre Arbeit zu teilen, sollte es meiner Meinung nach notwendig sein, dass neue Lernende sich wirklich damit vertraut machen. Davon abgesehen bin ich mir fast 98% sicher, dass es auf YouTube Tutorials für Github gibt (ich bin mit den 2% nicht einverstanden).

Ich habe noch nicht zu viel auf dieser Website gepostet, aber sobald ich herausgefunden habe, wie es funktioniert, weiß ich, dass ich es verwenden werde. Vielleicht sind Sie sich bei Kaggle ein bisschen unsicher, vielleicht ist das Posten auf Medium oder das Erstellen eines eigenen Blogs nicht Ihre Sache - aber zumindest sollte Github Teil Ihres Portfolios sein. Branchenexperten oder Mitarbeiter, die für Data Scientists-Positionen tätig sind, überprüfen Github häufig, wer was veröffentlicht und wie genau Ihr Code und Ihre Modelle sind. Github ist wie der Hammer in Ihrem Werkzeugkasten - Sie müssen ihn haben!

4. Twitter / Social Media

Schließlich denke ich, dass eine der beliebtesten Social-Media-Sites für Data Scientists Twitter ist. Natürlich gibt es Facebook (aber wollen Sie als Datenwissenschaftler FB nach dem Debakel wirklich nutzen?) Und LinkedIn. LinkedIn ist eine großartige Website, auf der Sie Artikel und Erkenntnisse an potenzielle zukünftige Arbeitgeber weitergeben oder Artikel lesen können, um Ihr eigenes Wissen zu erweitern.

Wenn Sie Ihre Erkenntnisse veröffentlichen möchten, vielleicht Artikel, die Sie geschrieben haben, oder Informationen zu den neuesten und besten in dieser Branche erhalten möchten, ist Twitter meiner Meinung nach die richtige Website für Sie. Es ist eine großartige Möglichkeit, mit Experten auf ihrem Gebiet in Kontakt zu treten und ihnen zu folgen, die häufig eigene Blogs haben, die Sie lesen können. Das Publikum im Bereich Data Science ist groß genug, um eine ganze Reihe von Menschen zu erreichen. Also tweet weg! Teilen Sie Ihre Erkenntnisse mit maximal 280 Zeichen.

Die Konstruktion

Wie auch immer Sie Ihr Data-Science-Portfolio aufbauen möchten, liegt ganz bei Ihnen. Vielleicht möchten Sie alle 4 Tools einbinden, vielleicht gar keine! Ich denke, das Wichtigste ist das Üben. Data Science, Analytics, Coding - das alles ist wie das Erlernen eines Instruments. Je mehr Sie üben, desto besser werden Sie und beherrschen Sie Ihr Handwerk, und es gibt nie einen Moment, in dem Sie nicht lernen. Ob Junior Analyst oder CEO - Praxis ist alles. Wenn die Leute Ihre Arbeit auf dem Weg sehen und Lob oder Feedback geben können, bringt es Sie diesem „Experten“ -Titel nur ein Stück näher!

Ich hoffe, diese Tipps haben Ihnen geholfen - lassen Sie mich wissen, ob Sie andere Tools zum Aufbau Ihres Data-Science-Portfolios verwenden. Hier finden Sie weitere Artikel, Fallstudien und Tutorials. Danke fürs Lesen!

Fröhliches Bauen :)