ITエンタメ通信

ブームを知り、己を知れば百戦危うからず

カテゴリー: 2014年12月17日
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
このメールは株式会社ラスターワークスより、過去にコンタクトさせて頂いた
お客様にお届けしております。今後このようなメールが不要な場合は、お送り
したメールの件名を削除し、件名に不要と入力してこのメールに返信して下さ
い。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

◇◆━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━◆◇
ITエンタメ通信  Vol.076    2014年12月17日(水)
  -- インターネットで
      エンタメ系サービスを提供されている皆様の為のメルマガ --
◆◇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━◇◆
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
■ ブームを知り、己を知れば百戦危うからず               (文中敬称略)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
■ Qiitaというサービス
----------------------------------------------------------------------

Qiitaというサービスのことをご存知でしょうか。
Qiitaとは、プログラマのための情報共有サイトで、次のような特徴がありま
す。

- 書式がMarkdown
- いいね + ブックマーク機能に相当する「ストックする」という機能があり、
自分の記事がどれくらい注目を集めているかわかる
- 編集リクエストという形で著者に対して修正したほうがよい箇所を指摘でき
る
- KobitoというQiitaに特化したエディタが用意されている

また、Qiitaは開かれたサービスですが、それとは別にプライベートに運用で
きるQiita:Teamというサービスが有料であり、ChatWork株式会社などで社内情
報共有のために使われているそうです。

■ Qiitaでブームを知る
----------------------------------------------------------------------

Qiitaは、(主に)プログラマの一般投稿で出来ていますので、最近の記事一
覧を眺めることで、

- こういう技術が流行っているんだなー
- こういうフレームワークが流行っているんだなー
- こういうサービスがあるんだなー

ということを素早くキャッチアップすることができます。
そして、ブームを知るのを(ある程度!)自動化しようというのが本記事の趣
旨になります。

■ Qiita APIを使ってブームを抽出する
----------------------------------------------------------------------

QiitaにはAPIとそのAPIを使うためのツールが用意されており、気軽にAPIを試
し
てみることができます。

https://github.com/increments/qiita-rb

今回はQiita APIを使って記事のタイトルを取得して、形態素解析を行い、名
詞の出現頻度を求めることによって、ブームを調べることにします。

■ ブームを抽出するための道具
----------------------------------------------------------------------

OSS全盛のこの時代、プログラミングレスも当たり前ということで、下記の
ツールを組み合わせてプログラミングなしで実現したいと思います。

- qiita(Qiita API)
- MeCab(形態素解析)
- jq(JSONパース)
- grep
- sort
- uniq
- bash

■ ブームを抽出する手順
----------------------------------------------------------------------

1. Qiita APIを使って記事の一覧を1万件取得して、テキストに保存

$ for i in $(seq 1 100) ; do bin/qiita list_items page=$i per_page=100
 > json/$1.json ; done


2. JSONからタイトルだけ抜き出して形態素解析を行い名詞の出現数をカウン
ト

$ jq -r '.[].title' json/*.json | mecab | grep "名詞,一般" | LC_ALL=C
sort -f | uniq -c | sort -n

あっというまですね。

■ 頻出名詞トップ30
----------------------------------------------------------------------

以上を実行した結果が次になります。

カウント 名詞
================
595 方法
334 インストール
273 環境
272 ファイル
230 js
222 コマンド
214 アプリ
192 Swift
161 Rails
152 文字
144 iOS
140 Mac
137 Ruby
134 データ
129 コード
122 まとめ
122 x
120 CentOS
118 API
117 Windows
111 画像
105 クラス
105 Android
 95 Yosemite
 94 スクリプト
 90 ライブラリ
 90 列
 89 複数
 87 自動
 86 言語
================

こうしてみてみると、「方法」や「インストール」「環境」といったHowTo系
の記事が多いことが伺えます。
プログラミング言語のカウント数は、js、Swift、Rubyの順です。今年出たば
かりのSwiftの記事がなかなか健闘しています。また、jsやRubyといったWeb系
寄りの言語が多いのは、Qiitaのユーザ層にWeb系のプログラマが多いという私
の直感とも一致しています。

■ ブームを知り、己を知れば百戦危うからず
----------------------------------------------------------------------

ブームの中身は玉石混交です。来年は玉石混交の中からきらめく宝石を見つけ
られる目を養う年にしたい思います。

皆様、良いお年を。 

(ih)

 ■ 第3水曜日配信 次回の配信は2015年1月21日(水)の予定です ■
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
●お問合せはこちらまで mailmag@lusterworks.co.jp
●ホームページ     http://www.lusterworks.co.jp
発行元:株式会社ラスターワークス
〒150-0002 渋谷区渋谷2-7-14 VORT青山 6F
TEL 03-5778-4501
●Android,iPhoneアプリの開発も承っております。
 お気軽にお声掛け下さいませ。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
ITエンタメ通信
発行システム:『まぐまぐ!』http://www.mag2.com/
配信中止はこちら http://www.mag2.com/m/0001090180.html
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 

ITエンタメ通信

発行周期: 第2第4水曜日に発行します。 最新号:  2017/07/19 部数:  87部

ついでに読みたい

ITエンタメ通信

発行周期:  第2第4水曜日に発行します。 最新号:  2017/07/19 部数:  87部

他のメルマガを読む