Data Gateway Talk vol.3に参加してきました
本日、Data Gateway Talk vol.3にブログ枠として参加してきました。LTの内容などイベントについてまとめてみます。 data-gateway-talk.connpass.com
Data Gateway Talkとは
イベントの趣旨についてはconnpassのページから引用します。
Data Gateway Talkはデータアナリスト/データサイエンティストの 登竜門(Gateway to Success)となることを目指した勉強会です。
Data Gateway Talk vol.3より
データアナリストやデータサイエンティストを対象としたカジュアルな勉強会だそうです。
学生さんの参加も大歓迎とのことなので次回以降ぜひご参加ください!!!
イベント会場とスポンサー(ZOZOUSEDさん)
会場は表参道から徒歩数分のZOZOUSED。 フロアが広い!あと真ん中の球体みたいな部屋あれ何ですか(伝わらない)
今回スポンサーとなったZOZOUSEDの方からサービスについて紹介がありました。
いくつかのサービスの中でピックアップされていたのが買い替え割。
過去にZOZOTOWNで購入した商品をその場で下取り&その場で割り引くサービスで、買う(ワクワクする)と売る(ワクワクしない)を一つにすることで「お得に買えた」という体験を提供することを目指したものだそうです。 買った/売ったというデータを収集し、値決めを機械学習で行っているという話もありました。
イベントの雰囲気
どちらかというと初心者向けの勉強会ということもあり、若い人が多い! おそらく20代~30代前半の方がほとんどだったのではないでしょうか。あと学生の方も数名いらっしゃいましたね。
ところであなたは?
申し遅れました。ゆきはら@wannko5296といいます。
Japanese Traditional CompanyでSEとして業務アプリケーションの設計・開発に従事してます。実はデータ分析業務に携わったことのない未経験者なのですが、近々データアナリスト(仮)として新しい仕事を始める予定です。
データ分析の世界に足を踏み入れるにあたり、データアナリストやデータサイエンティストのお仕事について実際に業務に従事している方から話を聞いてみたいと思い、今回参加することにしました。
LTの要約と所感
※随時追記修正していきます
※私の個人的な解釈で書いているので本来の意図と異なった表現になっているかもしれません。そのときは一報ください。
あの日みたデータの「サイエンス」を僕たちはまだ知らない by 伊藤さん
データサイエンスの「サイエンス」の部分に焦点を当て、ご自身の考えを熱く語っていました。熱すぎて時間オーバーしたみたいですが...笑
はじめにそもそも科学(サイエンス)とは何か?について話がありました。一部をまとめてみます。
- 「科学は証拠を要求する」
→主張の妥当性を示す「答え」としてデータが存在する。 - 「科学は論理と創造力の融合である」
→データを見て考えることで得られる命題が「仮説」で、それが検証可能性を持たなければならない。 - 「科学は説明し、予測する」
→現象を説明/予測することができる - 「科学は偏向を特定し回避する」
「キャンペーンが良かったから売上が伸びた」と安直に判断すべきではない。認知バイアスは避けられないので疑う姿勢は必要。
研究とビジネスとの関係性の話では、一般的に研究とビジネスに懸隔があるとされているが実際そんなに大きな違いはないという旨で話されていました。
- 研究とビジネスを違う?
→ビジネスでも主張には証拠が必要 - データサイエンスは科学か? →ビジネス的答えは一般原則でなくてもよい
次いで仮説設定の話がありました。
- 仮説は検証されなきゃ意味がない
- 炎上するパターン
→仮説の設定論理が破綻している - 意味のない検証
→真偽が検証前にわかる or 真偽わからずとも検証のしようがない仮説は検証できない - こけない仮説設定
「仮説の真偽がはっきりする検証可能な仮説」が理想的で、「確かめられる」ことが重要
個人的には仮説の話が特に面白く感じました。価値のある分析を実現するためにはそもそも仮説自体の質が求められるということですね。
ZOZOUSEDのデータ活用事例紹介と個人のキャリアの話 by 佐々木さん
佐々木さんはZOZOUSEDで販売価格予測モデルの開発などに従事されているそうです。
価格を予測できれば実態に即した値付けができ、ユーザーも会社も嬉しいのではないかというアイデアから始まったそうです。 販売価格の予測モデルを構築し、的中率1.5倍を達成したとのこと。
次いでその成功要因の話です。
求められていたのはわずかばかりのデータサイエンス力で、サービスがよくなるような全体設計などが功を奏したと省察されています。 より良いモデルをつくるにあたり、新品と中古という2段階の大量のデータがあったことも成功した要因としてあるとのことでした。 また、精緻なモデルを時間をかけて作り上げるのではなく、そこそこの精度でも早期に実装・改善し現状を上回る成果を出せたようです。
最後にキャリアのお話。 企業経営だけでなく個人のキャリアにおいてもポジショニングが重要とのこと。 企業のデータ活用度、個人のデータサイエンス力のマトリックスでどこに自らを位置づけるかという話がありました。
技術や制度に拘泥するのではなく、価値を出すためには全体設計や実装・改善のスピードアップなども重要であるということですね。結構端折り気味で話されていた印象ですが非常におもしろく感じました!
KPIという制約と創造性 by 滑川さん
データプラットフォームの構築、データ活用支援に従事されてるそうです。
LTの内容としてはKPI設定の難しさとKPIに求められる要素についてのお話。
- 目的や粒度、期間はどうするか?
- 計測可能か、MECEか、行動目標か結果目標なのか
KPIの役割は「スコープを定めること」
何に注力するかを明確にする。
「制約が創造性を生む」
→制約によってできないことを解決しようと考える
スコープを定める=制約をかける
例えば... チームのKPIが売上だったら...
楽しいことが考えられるようなKPIにすべき。
そのKPIは創造性を高められているか。
名言の多いLT。KPI設定という悩み多き分野についてわかりやすくお話しくださいました。
制約が創造性を生むという言葉は今後使わせていただきます(笑)
姿勢推定とLightGBMを⽤いたテニスのスイング認識 by 持丸さん
www.slideshare.net
パッケージ開発や画像分析に従事されてるそうです!
あと「データサイエンすたんぷ」が絶賛発売中だそうです。かわいいですね。 www.line-tatsujin.com
テニスで強くなるために何をすべきか考えたときに相手が打つボールの軌道を予測できればよいのではないかという発想でスイング種類を分類するモデルを作ったそうです。技術的内容が多かったので詳細はスライドを見たほうがよいかと思います。
スイングの種類を判別する要素としては手首が重要。また、フェデラーで試してもおおむね予測が合っていたそうです。
テニス愛...すごい。労力をかけてここまで実践したこと自体すごいですし成果が出ているのもすごいですね!
BtoB分野のデータサイエンティストとして5年生きた四方山話をする by 吉田さん
画像分析や機械学習システムの導入などに携わっているそうです。
受託分析サービスという形態で、クライアント企業からデータを受領し、分析業務を請け負い、データにまつわる課題解決を行っているとのこと。
PM1名、DS作業1,2名、営業1名、3か月くらいでプロジェクトを推進することが多いようです。
分析結果がAでもBでも行動が変わらないのなら分析の意味がない
→分析の出口を意識した分析が重要
プロジェクトのスコープ・プロセスとしては、ビジネス課題設定→分析設計→分析作業→意思決定という流れで、アルゴリズムのシステム化までやるタイプも多いようです。
実際、お客様が喜ばれることについてもお話があり、以下2点が特に喜ばれるそうです。
- 課題特定
- 意思決定の判断材料の提供
→
顧客が欲しいのは「意思決定」
役割名 | 内容 |
---|---|
エグゼキューター | DS, エンジニア |
ディレクター | 用意された舞台で最高のものをつくる |
プロデューサー | 舞台をつくる |
DSが上流工程系の仕事にジョブチェンジ
→用意された舞台ではなく、自身で舞台自体を作り上げたい?
お客様の期待する制度までいかなかったら?
→事前に期待値調整して代替案を出しておく
技術的に難しいときは?
→問題を整理し他のアプローチで解く
プロジェクト失敗時の後悔
→あの人と話をつけておけば
「期待値調整」が大切
→分析は何がアウトプットになるかわかりにくい(無形)
ラピッドプロトタイピング
→「人間は具体物」がないと正しくディスカッションできない」
具体物
→コミュニケーションの質が上がる、スピードもとても重要
PoCなどで動くものを作り、チームの熱量が高まったところでお願いをするというやり方
まとめ
- 分析の目的はビジネス課題の解決
- 顧客が欲しいのは「意思決定」 not 100%の正しい答え
- 分析の仕事とコミュニケーション→期待値調整
受託という立場でデータ分析するにあたって実際に直面した課題とその解決策について言及されていて非常に勉強になりました!
懇親会
そこまで多くの方と会話できたわけではありませんが、ほとんどが実際にデータ分析に関する業務に従事されている方でした。おそらく社会人1桁年の方がほとんどですね。あとはDSを志す学生さん方。
分析手法の話から実務での困りごとの話まで幅広い話を聞くことができ、普段狭い世界にいる私にとっては非常に有益でした。
個人的な所感
LTはどれもおもしろかったですし、何より勉強になりました!
具体的な分析手法に言及した話も当然ありましたが、全体としてはデータ分析に関するマインドセットの話が多かったです。その点、データサイエンスについてあまり知識のない方(私も)でも楽しめる内容だったかと思います!
懇親会も参加したのですが、私からするとみなさん結構つよつよだなという印象を受けました。 というか、思いのほか知らない単語や概念が出てきたりしたので自身の勉強不足を痛感しました。そういう感情を抱けたことが今回の一番の収穫だと思っています。
最後に
登壇者の方や企画・運営をされている方々に感謝感謝です。
次回も参加したい!