Slackのログ分析してみた

こんにちは。弥生エンジニアの白井です。

この記事はMisoca+弥生+ALTOA Advent Calendar 2018 18日目の記事です

みなさんSlack使っていますか??😃

様々な企業で導入されているチャットツールのSlackですが、実は弥生も導入しています!!

「えっ弥生ってSlackとか使うような企業なの?!」「いわゆるおかたい会社でメールばっかり使ってそう」…なーんて思われそう(?)ですが、開発部だけではなく全社的に使っているんですよ😏

正直まだまだメールも使われていますが、Slackの導入によって部門部署を超えたやり取りがかなりスムーズになりました👏

使ってくると…データを分析したくなりますよね?

さて導入してしばらくたつと…データが気になってきますよね

  • みんなどんな風に使っているんだろう?🤔
  • チャンネル別や人別に調査したら面白いんじゃないのかな?

というわけでデータ分析してみました!!

Slackのログを分析してみる~準備編~

まずはどんなデータを集められるか調べてみましょう

Slackから出力できるデータを確認する

Slackはパブリックチャンネルのすべてのログをエクスポートできるようですね👌

中を確認すると、以下のファイルがJSON形式になっていることを確認できます

  • ユーザー一覧ファイル
  • チャンネル一覧ファイル
  • チャンネルフォルダ / 日別のメッセージ一覧ファイル

データを加工する

JSON形式のままだと汎用的な集計とかがやりにくいので、ささっとCSVに加工しちゃいましょう😎

とりあえずメッセージの件数だったりリアクションの件数だったりメンション関係がみたいな~と思うので全部分解することにします。

例えば以下のような会話があった時

発言ユーザ 内容 リアクション
ユーザー1 @ユーザー2 よろしく! 🙆:ユーザー2 👍:ユーザー3
ユーザー2 帰りたい 🏃: ユーザー1
ユーザー1 しごおわ 👏:ユーザー3

↓↓↓このように分解してCSVを作成します↓↓↓

メッセージ.csv

発言NO 発言ユーザ 内容
1 ユーザー1 @ユーザー2 よろしく!
2 ユーザー2 帰りたい
3 ユーザー1 しごおわ

リアクション.csv

発言NO 発言ユーザ リアクションユーザー 絵文字
1 ユーザー1 ユーザー2 🙆
1 ユーザー1 ユーザー3 👍
2 ユーザー2 ユーザー1 🏃
2 ユーザー1 ユーザー3 👏

メンション.csv

発言NO 発言ユーザ メンションユーザー
1 ユーザー1 ユーザー2

このように分解することで人別の発言数やリアクション数、被リアクション数などがExcelのピボットテーブルで集計しやすくなります🙆

Slackのログ分析してみる~分析編~

分析をしてみて面白い結果が出たものを中心に紹介してみます!

チャンネル別発言数・リアクション数ランキング

まずはどのチャンネルの発言数・リアクション数が多いのか調べてみました!

f:id:ym_AdventC:20181212162545p:plain

  • カスタマー系の発言量・リアクション量はダントツで多いですね!!
    • 何を隠そう弥生は業界最大規模のカスタマーセンターを持っているのですが、Slackもばっちり活用しているのです😎さすがですね!
    • プロダクトチャンネルも負けていられないので、もっと盛り上げないと👊
  • カスタマー系以外のチャンネルは発言数よりもリアクション数が少ない傾向?
    • ※チャンネル毎の人数の違いが影響している可能性があるので、一概に言えないですが…(人が多くなるとリアクションが多くなりそう)
    • もう少し細かく見ないとわからないですが、リアクションよりもスレッドで反応しているのかも…?🤔
    • 誰も反応していない発言はないと思いたいですね…😰

月別アクティブユーザー数推移

次は日常的にSlackを使っているユーザー(アクティブユーザー)はどれくらい変化したのかを調査しました。

f:id:ym_AdventC:20181212162621p:plain

  • 半年で着実にアクティブユーザーが増えているようですね!👌
  • ちなみに日別・週別の発言ユーザー数であればSlackアナリティクスでも確認できます

人別発言数・リアクション数・被リアクション数

今度は私のチーム内で人別の発言・リアクション・被リアクションを見てみました

f:id:ym_AdventC:20181212164943p:plain

  • PM・TechL(テクニカルリーダー)の方はどの数値も高いですね
    • 報告・連絡系の発言が多いので被リアクション数が高くなる様子
  • 人によって発言・リアクションのバランスが違うのもよくわかります
    • 私(白井)は明らかにリアクションしすぎですね。。。遊びすぎです。笑
    • Eng(エンジニア)は人によって形がかなり違うことがわかります
    • EngHさん「リアクション?したことないよ」とのこと…ゴーイングマイウェイですね😏

メンションネットワーク図

頑張ってメンションネットワーク図を出してみました😉

発言数が多い人ほど円が大きくなり、会話でメンションのつながりが発生するほどに線が太くなるようにしてます。

人数が多すぎると図がわけわからなくなるのでTOP20人に限定してみると、こんな感じです!

f:id:ym_AdventC:20181213084250p:plain

  • やはり中心はさすがのPMですね!
    • いろいろな立場の人と連携が取れていることがわかります
  • 私(左の方)はデータ抽出などを情シスの方に頻繁に依頼しているので、つながりが強くなっていますね

こんな風に見てみると、誰と誰が繋がりが強くて、誰が離れているかよくわかりますね!

ちなみにネットワーク図はPythonのNetworkXを使って、Jupyter Notebookで出力しましたよ~

まとめ:Slackのデータ分析は楽しい

こんな風にSlackのログを分析してみると、いろいろな切り口でSlackの状況を知ることができます!

よかったらみなさんもログ分析を試してみてください😉

NEXT

Misoca+弥生+ALTOA Advent Calendar 2018 、次は@naoki_hayashiさんの「たぶんECS+EFS」です!お楽しみに~