IT系勉強会を開催する前に知っておきたいこと(2)~Rで分析してみよう~
こんにちは、iotasです。
前回に引き続き、RでIT系勉強会の分析をしていきたいと思います。
前回は「IT系勉強会がどの辺で多く開催されているのか」という観点から見てみましたが、今回は視点を変えて「IT系企業がどの辺に分布しているか」という観点で見てみたいと思います。
データ集め
前回のコードを流用すれば、地図上に密度を描画できることがわかっていますので、データ集めさえすれば大丈夫です。
私はiタウンページから、ひたすらネット企業を抽出して手で補正するという単純作業を繰り返しましたが、クローラーの知識があれば、プログラムを書いて機械的にやった方がよいと思います。
私自身、なぜこの部分を手でやろうと思ってしまったのか、今となってはわかりません。
とにかく、単純作業をひたすら繰り返した結果、2,000件程度のデータが集まりました。エンジニアとしての魂は失った代わりに、なにがしかの徳は積めたような気がします。
データの補正
住所から経度・緯度を取り出すには、前回のようにGoogle Maps Geocoding APIを使います。
今回は件数が多かったので、区ごとにデータをマージして、区役所の所在地にまとめてプロットすることにしました。
プロットする
前回とほぼ同じコードを使います。
一応掲載します。
library(ggplot2) library(ggmap) library(scales) # プロット用のCSVのパスを記載します internet_company_landscape <- read.csv("it_com_location.csv", fileEncoding="shift-jis") # get map area loc=c(min(internet_company_landscape$lng), min(internet_company_landscape$lat), max(internet_company_landscape$lng), max(internet_company_landscape$lat)) # get map data from google Map = ggmap(get_map(location=loc, zoom=12, source="google"))+xlab("")+ylab("") internet_company_p <- Map + stat_density2d(data=internet_company_landscape, aes(fill=..level..,x=lng, y=lat, alpha=0.1), geom="polygon") + scale_fill_continuous(low = "green", high = "red") + geom_point(data=internet_company_landscape, aes(x=lng, y=lat), color = "black")+ scale_alpha_continuous(guide="none",range=c(0,.2)) internet_company_p
結果はこうなりました。
比較する
前回作成したIT系勉強会の分布と比較してみます。
こうしてみると、「渋谷は、IT系勉強会の数ほどにはIT企業の数がなく」、「港区は、IT系勉強会は少ない一方でIT系企業は多い」ということが見えてきます。
渋谷と比べて、IT系企業の数で遜色のない港区・千代田区といった地域でも、集客は見込めそうです。
特に、六本木・品川(駅)・新橋といった港区の企業に勤めている方が、会社帰りに立ち寄ってくれるような勉強会を開催すれば集客が期待できそう。
(分散メッセージングシステムみたいな大規模ユーザー向けシステムの話題とか?)
終わりに
今回は「集客」という観点からIT系勉強会をみてみましたが、実際に「集客」「集客」と血眼になって分析するようなケースは多くないかもしれません。
(個人的な趣味でやるような勉強会では特に)
ただ、IT系勉強会を開催する前に、「どのような人が来そうなのか」「どんな話題を出せば楽しんでもらえるのか」といった観点で考えてみるのは、自分たちの不安を解消する意味でも有益です。
もし、「勉強会を主催しようかな」と考えているのであれば、遊びがてらにでも分析してみてはいかがでしょうか。