データサイエンティストとして成功するために必要なソフトスキル

Soft skills necessary for succeeding as a data scientist.

データサイエンティストとしてのキャリアを進めるためのトップ5のソフトスキル

Photo by Jason Goodman on Unsplash

あなたの旅の概要

  1. 導入
  2. スキル1 — コミュニケーション
  3. スキル2 — コラボレーション
  4. スキル3 — 好奇心
  5. スキル4 — プロジェクト管理
  6. スキル5 — メンタリング
  7. まとめ

導入

データサイエンティストとしてのキャリアを進めるにあたり、ハードスキルに焦点を当てることは簡単です。SVMを非線形カーネルで学ぶ、MLflowのような新しいソフトウェア技術を学ぶ、ChatGPTのような新しいAIトレンドを学ぶなど、新しいMLアルゴリズムを学ぶことを望むかもしれません。

これらのスキルは学びやすいです。なぜなら、成功を測定するのが簡単だからです。MLflowを例に挙げてみましょう。まず、MLflowがMLライフサイクルに提供できることについて学び始めるかもしれません。モデルアーティファクト、MLプロジェクト構造、モデル登録について学びます。コースを終え、ユーザーガイドを数時間読んで、実際のプロジェクトに実装することさえできます。素晴らしい!これにより、あなたは自信を持って、あなたがMLflowを知っていることを言い、CVのスキルセットに追加できます。

時間管理のようなソフトスキルはどうでしょうか?同じプロセスをどのように進めるのでしょうか?本当に立ち止まって考えてみてください。時間管理に関する本はたくさんありますが、それはMLflowのドキュメントを読むほど具体的ではありません。日常のルーティンに時間管理を実装することができますが、MLflowをMLプロジェクトに実装するほど明確ではありません。時間管理をCVにリストアップすることができますが、それはどういう意味ですか? 😧

ソフトスキルは、その性質上、より具体的ではないため、測定するのが難しいという事実があります。多くの人々は、ソフトスキルがハードスキルよりも価値が低いと結論付けます。しかし、これは致命的な間違いです!何かを測定することが難しいというだけで、それが取り組む価値がないということではありません!

私たちは皆、時間管理を非常にうまくこなしている同僚を経験したことがあると思います。彼らの出力はほとんど他の人々の2倍だったというのは、ほとんど不可能なブーストです。これは、ハードスキルで得られるものとは比較にならないほどの価値を提供することができます 🔥

これは特にデータサイエンスに当てはまります。データサイエンティストのポジティブなステレオタイプは、優れた問題解決能力を持つ人物です。ネガティブなステレオタイプは、ビジネス環境で成功するために必要な一般的なソフトスキルにやや欠けていることです。ソフトスキルに時間を費やすことで、大きなアドバンテージを得て、自分自身のキャリアパスを築くことができます

このブログ投稿では、データサイエンティストが成功するために必要なトップ5のソフトスキルを学びます。これはもちろん、私自身の意見に基づくものです。しかし、私の意見は、多くの他のデータサイエンティストを見て、何が他の人々と差をつけたのかを見て形成されました。

スキル1 — コミュニケーション

最初のスキルは、とても基本的です。あなたはコミュニケーションを上手にする必要があります。以下が含まれます:

  • 探索的データ分析(EDA)フェーズの調査結果を明確に伝えることができるようにする必要があります。神のために、聴衆に合わせてカスタマイズしてください。CEOは、データを適合させるために選択した分布や、実験を実行するために使用したDockerイメージについて聞きたいわけではありません。CEOはデータサイエンスに熱心かもしれませんが、それ以外にも何百ものことを考慮する必要があります。EDAの概要を高レベルで説明し、CEOのビジネス成果に焦点を当ててください。
  • トークをするときは、聴衆にとって価値のあることを言うようにしてください。これは明らかなことのように聞こえますが、明らかにそうではありません。自分自身をスマートに聞こえるために、複雑なアーキテクチャや複雑なハイパーパラメータチューニングについて話をする必要はありません。これは防御策に過ぎません。むしろ、あなたが言ったことが聴衆に何か価値を提供するようにしてください。そうすることで、話したことについて話し合いたいと思う人が突然現れます。
  • 他の人と話すときは、相手が何を言っているかを聞くようにしてください。これは、うなずいて自分の番が来るのを待つのとは違います。実際に聞くということは、スピーカーの立場に自分自身を置き、慎重に彼らの視点を理解しようとすることです。製品オーナーが、より速いペースとより少ない探索を望んでいると説明したと仮定しましょう。彼らが間違っていることを説明するのを待っているのではなく、実際に聞いてみてください。製品オーナーは進捗状況に評価されているかもしれず、探索的分析のアップサイドを理解していないかもしれません。そして、探索的分析は、正直言って、必要以上に長引いてしまったかもしれません。聞くことを試み、製品オーナーと一緒に良い解決策を見つけてください。

さらに、あなたは文章のスキルを磨く必要があります。本当に。酷いわけではありませんが、もう少し簡潔に書くことができます。複雑な文を書いたり、必要のない説明をしたり、あなたが思っているほど重要でない詳細について語り続ける傾向があります。心配しないでください、私も同じです 😳

簡潔さは自信の証です。 次の2つの返信を比較して、来週金曜日までに機能要求を満たすように求められた電子メールに対するものです:

  • 来週の金曜日までに可能になると思います。問題を調べて解決策のスペースを理解し、反復的な方法でそれに取り組みます。必要があればアドバイスを求め、それ以外の場合は、要求されたように機能を完成させるための目標に向けて進んでいきます。すべてがうまくいくことを確信しており、来週金曜日までに満足のいく結果を提供できると思います。
  • 来週の金曜日までにそれを提供するために取り組みます。障害が発生した場合はアドバイスを求めます。

最初の声明にはあまり情報がありません。あなたの仕事の反復と満足のいく結果の約束について曖昧な話が含まれています。プロジェクトマネージャーやテックリードといった人たちが毎日読まなければならないようなものを想像してください。これを切り捨ててください!プロフェッショナルな方法で言いたいことを言って、その後手当たり次第に問題を解決してください。

スキル2 — 協働

影響力のあるデータサイエンスの仕事は、ほとんどの場合、一人のデータサイエンティストによって行われるわけではありません。もちろん、いくつかの例外があります。しかし、ほとんどの影響力のあるデータサイエンスは、データプロフェッショナルのチームによって、フロントエンド/バックエンドの開発者、プラットフォームエンジニア、テスター、ドメインエキスパート、プロジェクトマネージャーなどの他の職業の支援を受けて行われます。

これは、協働が成功するために必要不可欠であるだけでなく、有用であることを意味します。協働スキルを向上させるためには、次のような方法があります。

  • 他の役割に依存する場合、あなたの仕事と彼らのインターフェースを理解してください。 データエンジニアと協働していると仮定します。彼らはDatabricksまたはSynapse AnalyticsでSparkを書いています。彼らの仕事の出力は、データサイエンスのためにクリーンされ、正しい形式であるテーブルです。しかし、正しいフォーマットとは何でしょうか?これは、使用する機能と使用するアルゴリズムに完全に依存します。あなたが使用しないことを計画している列をデータエンジニアが細心の注意を払ってクリーニングする状況になりたくありません。これは、協働が悪い状態であることの兆候です。
  • 他の役割があなたに依存する場合、良好な協働のための早期の計画を立ててください。 リアルタイムデータを取り込んで値を予測するMLモデルを開発する予定であると仮定します。予測はフロントエンドアプリのユーザーと内部のPower BIダッシュボードの両方に送信されます。その後、フロントエンド開発者とデータアナリストは、データの将来的なフォーマットに関して情報を共有される必要があります。データの正確な構造に関するモックデータを提供することさえできます。これにより、あなたに依存する人々が彼らの仕事を終えるまで待つ必要がなくなります。人々がよく協働しているときは、並列処理のようになります。そうでない場合は、シングルスレッドになり、すべてが遅くなります。
  • 他のデータサイエンティストと協働する場合、明確な所有権を委任してください。 データサイエンティストは、様々なバックグラウンドから来ているため、彼らのスキルセットは非常に異なります。モデルの精度をさらに向上させることが得意なデータサイエンティストと、モデルを設定し、データドリフトを監視することが得意な別のデータサイエンティストがいるかもしれません。経験に基づいて、異なる人が異なる側面の所有権を持つことができます。しかし、どのデータサイエンティストもすべての側面に貢献することができます。

最後に、データサイエンスとは何の関係もないより一般的なことがあります。同じチームで働くすべての人々は、尊重されるに値します。これは、彼らの技術的な背景、スキルレベル、性別、または常識に関係のない他の要因に独立しています。

人は時に間違いを犯します。間違いを認めつつ、間違いは学びの自然な一部であることを確認することが重要です。あなたは、報復や嘲笑の恐れなく誤りを認められるチームの文化を作ることを最適化する必要があります。そのような文化を作り出すことに失敗した場合、間違いが止まるわけではありません。ただ、見逃されているだけで、後で修正するのがはるかに難しくなります。

スキル3 — 好奇心

Photo by nine koepfer on Unsplash

私は常に、データサイエンティストは自然に好奇心が旺盛な人々だと感じています。彼らは新しいMLアルゴリズムを学ぶことが好きで、自分たちの分野での新しい展開を追跡することが好きです。しかし、この好奇心が近隣の学問分野、技術、方法、アプローチにまで広がるかどうかは、非常に多様です。

一部のデータサイエンティストは、ソフトウェア開発、デザイン原則、プロジェクトマネジメント、データ分析、データエンジニアリング、ビジネスインパクトなどについて詳しく学びたがっています。他の人は自分たちのバブルにこだわり、データサイエンスだけに取り組みたいと考えています。これは完全に問題ありませんが、近隣の分野を探求する好奇心を持つ同僚よりも、評価が低くなることに驚かないでください。

これは不公平ですか?実際にはそうではありません🤷

ソフトウェア開発を知っているデータサイエンティストは、知らない人よりも単純に役立ちます。ソフトウェア開発のスキルにより、データサイエンティストが取り組む可能性のあるプロジェクトが増えます。フロントエンド/バックエンドの開発者やデータエンジニアなどの役割とのインターフェースも、一気通貫になります。

他の人はあなたの出力を自分自身のレンズで見るだけです。テスターが複数のコンポーネントの統合テストを実行するように依頼された場合、あなたが書いたコンポーネントがよく文書化され、モジュール化され、良いコーディング標準を使用し、単体テストがある場合、テスターの仕事ははるかに簡単になります。一方、大量のフリーフローのコードがあるだけの巨大なRスクリプトがある場合、テスターはエラーを追跡するのに多くの作業が必要になります。自然に、テスターは、ソフトウェアの側面に努力を注ぐ人物がより熟練していると考えるでしょう。これはスクリプト内のMLモデルが何をするかに関係なく、独立しています。

ビジネスインパクトももう1つの定番です。データサイエンティストが受ける最も一般的なネガティブフィードバックの1つは、ビジネス目標から遠ざかりすぎているということです。ビジネスを理解し、ROIを生み出すデータサイエンスのユースケースを考えるデータサイエンティストは、自然にビジネスにとってより価値があります。

では、どのようにしてこの広範な好奇心に取り組めばよいのでしょうか?他の分野に費やすことができる時間に限りがあるため、一般的な提案が2つあります。

  • 他の役割が何に取り組んでいるのかを理解しようとする時間を少し費やす。ビジネスアナリストと話をすると、KPIやOKRのいくつかの知識を簡単に身につけることができますが、この知識は非常に価値があります。個人的には、私は情報学のバックグラウンドがないので、コンピューターネットワークについてほとんど知りません。しかし、私はなぜプライベートネットワークを使用するのか、これを設定する方法の(非常に)大まかな概要、これを投資するのが適切である場合などを知っています。私は主にネットワークエンジニアと話をすることでこの知識を得ました。この知識は、ネットワークエンジニアに連絡する時期を知るために非常に表面的ですが、価値があります。
  • プロジェクトに取り組むときには、少し快適な領域から外れる機会を逃さないようにしましょう。誰かが継続的な統合パイプラインで自動リントを実装する必要がありますか?私がやってみます!CI / CDやYAMLファイルについてあまり知らなくても、おそらくそれを理解できるでしょう。できない場合は、いつでも助けを求めることができます。新しいことを学ぶ機会に飛びつくことで、新しいことを学ぶことができます。知っている、それは非常に深いです😉

スキル4-プロジェクト管理

前回のチームプロジェクトを思い出してください。期限に達しなかったプロジェクトや予算超過になったプロジェクトについて考えてみてください。共通点は何ですか?ハイパーパラメータの調整が少なすぎることですか?モデルアーティファクトの記録が不十分であることですか?

おそらくそうではありませんよね?プロジェクトの失敗の最も一般的な理由の1つは、悪いプロジェクト管理です。プロジェクト管理には、プロジェクトを管理可能な段階に分割する責任があります。その後、各段階は継続的に残りの作業量が見積もられるべきです。

スプリントの実行からレトロスペクティブまで、決定的なプロジェクトマネージャーが責任を持つことができる範囲ははるかに広いです。しかし、私はプロジェクトマネジメントを役割としてではなく、スキルとして重視したいと思っています。チーム内の誰でも、リーダーシップをスキルとして表示できるように、チーム内の誰でもプロジェクト管理をスキルとして表示できます。そして、データサイエンティストにとって、これは非常に有用なスキルです。

具体的には、単一の段階を見積もることに焦点を当ててみましょう。実際のところ、データサイエンスの作業の多くは非常に見積もりが難しいです。

  • データクリーニングフェーズはどれくらいかかりますか?作業するデータに完全に依存します。
  • 探索的データ分析フェーズはどれくらいかかりますか?途中で見つけたものに完全に依存します。

私の言いたいことはわかりますよね。これにより、データサイエンスプロジェクトのフェーズの期間を推定することは無意味だと考える人が多くなりました。

私はこれが誤った結論であると考えています。より正確なのは、データサイエンスフェーズの期間を正確に推定することがフェーズを開始する前には困難であるということです。しかし、プロジェクト管理は、連続的な推定を行うことで機能します。少なくとも、これが良いプロジェクト管理が行うべきことです😁

先にデータクリーニングの仕事を推定する代わりに、データクリーニングのタスクを進めて1週間が経過しました。今、異なるデータベースに保存された3つのデータソースがあることがわかりました。2つのデータベースには適切なドキュメントがなく、最後の1つにはデータモデルが不足していますが、かなりよく文書化されています。3つのデータソースすべてに欠落しているデータがありますが、思っていたほど多くないです。これについて何が言えますか?

確かに、あなたはゼロの情報を持っていません。データクリーニングの仕事が明日終わるわけではないことを知っています。一方で、この仕事に3か月もかかることは非常に確かです。したがって、フェーズが完了する確率を与える分布を持っています。この分布には「平均」(フェーズの期間の推定値)と「標準偏差」(推定値の不確実性の量)があります。

重要な点は、この概念的な分布が毎日変化することです。行う必要がある作業についてますます多くの情報を得ます。自然に、不確実性の量は、フェーズが完了する時期についてより確信を持つようになるにつれて時間の経過とともに縮小していきます。あなたの仕事は、ステークホルダーにこの情報を定量化することです。そして、ステークホルダーに説明するときに使用した分布言語は、私たちの間に置いておくことができます。

こういったことが言えるデータサイエンティストを抱えることは非常に貴重です。

「このフェーズには3週間から6週間かかると思います。1週間後により正確な見積もりを提供できます。」

スキル5-メンター

ジュニアデータサイエンティストのメンタリングは、しばしば必要なものと見なされています。それは確かに正直な仕事ですが、あまり強調されていません。もしジュニアデータサイエンティストが自分自身で概念を魔法のように学べるのであれば、それが望ましいですよね?

おそらくお分かりのように、私は反対しています。ジュニアデータサイエンティストのメンタリングは、あなたと彼らの両方にとって非常に役立ちます。以下に3つの理由があります。

  • 概念を説明することで多くを学びます: これはかなり簡単です。ジュニアデータサイエンティストに概念や考えを説明することで、あなた自身も概念をより良く理解することができます。私はしばしば、ジュニアデータサイエンティストに何かを説明することが、私が何かをより明確に表現するのを助けたことがあります。誰かがあなたに質問をするときに、あなたが思っていたほど何かを理解していないことに気づくことがよくあります。これはトピックについてもっと学ぶための素晴らしい機会です。さらに、ジュニアデータサイエンティストに、すべてを知っている必要はないということを強調することができます。実際、これは避けられないことです。
  • 少しのマネジメント経験を得られます: すぐに、あなたはより上級の役割、例えばチーフデータサイエンティストのような役割に移るかもしれません。このような役割には、他の従業員に対する正式なマネジメント責任があるわけではありません。それでも、リードや影響を与えることができると期待されています。他のスキルと同様に、これには練習が必要です。日々のデータクリーニングやモデル調整では、このようなことにはほとんど練習する機会がありません。だからこそ、誰もメンターをしない場合は、リードや影響を与えるのに苦労することに驚かないでしょう。そして、マネジメントトラックに入る可能性を考える場合、過去にメンタリングの責任を持ったことがない場合は少し注意が必要です。なぜ誰もメンタリングをしてくれなかったのでしょうか?あなたがそれをしたくないからなのか、他の人たちがあなたにそれをしてほしくなかったからなのか?これらの可能性のどれも素晴らしい状況ではありません。
  • ジュニアデータサイエンティストとのつながりを築くことができます: もちろん、メンターとジュニアデータサイエンティストの間には自然なパワーバランスが存在します。それでも、メンターがうまくやる場合、ジュニアデータサイエンティストは最もつながりを持つことが多い人物です。ジュニアデータサイエンティストを指導し責任を持つことで、あなたはすぐに自分が指導した人たちに囲まれることになります。これらの人たちはあなたに尊敬を抱き、あなたのアドバイスを大切にしています。これはそんなに悪い状況ではありません。

私のアドバイスは、あなたのキャリアで早くメンターになることです。上記の3つの利点は、メンタリングの仕事を真剣に取り組む場合にのみ有効です。メンタリングをうまく行わない場合、利点が少なくなり、悪いメンターであるとの評判を負う可能性があります 😬

一部の企業は、メンタリングに対して非常に低い期待しか持っていません。月に一度、ジュニアデータサイエンティストと一緒にコーヒーを飲むように依頼されることがあります。私は、義務を超えることをお勧めします。 ジュニアデータサイエンティストに、問題や質問があればいつでも相談できるように申し出てください。こうしたジュニアデータサイエンティストのサポートは、明示的に依頼されなくても責任を引き受けることができることを示すサインです。

まとめ

Photo by Spencer Bergen on Unsplash

このブログポストでは、データサイエンティストがキャリアを前進させるためにソフトスキルが非常に価値があることを見てきました。データサイエンスのシニア候補者を面接する際には、ハードスキルと同様に蓄積されたソフトスキルを見ます。データサイエンティストに必要な他のソフトスキルがある場合は、コメントに書き込んでください。

データサイエンス、プログラミング、またはその間の何かに興味がある場合は、LinkedInでフォローして挨拶してください ✋

私の執筆が好きですか? もっとPythonコンテンツを読むには、以下の投稿をご覧ください:

  • Modernize Your Sinful Python Code with Beautiful Type Hints
  • Visualizing Missing Values in Python is Shockingly Easy
  • Introducing Anomaly/Outlier Detection in Python with PyOD 🔥
  • 5 Awesome NumPy Functions That Can Save You in a Pinch
  • 5 Expert Tips to Skyrocket Your Dictionary Skills in Python 🚀

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more