tetsunosukeのnotebook

tetsunosukeのメモです

2014年を振り返る

うわっ・・・今年ブログ書かなすぎ・・・

この会社に来てから会社員人生としては最悪だった一年だった気がする。
ん。会社員人生としてはいいのかもしれないけど、人生としては最悪、なのかもしれない。

友人のFacebookで「最近欲がない」という投稿を見たのだが、たいへん言い得て妙であり、自分もそういうところが増えてきている。承認欲求もしかり、「なんとなく美味しいものが食べたい」という気持ちがあっても「これが食べたい」がなかったり。

とにもかくにも不健康。

2013年末まで心身ともにやられるプロジェクトが終わって、それが癒えぬまま年明けに突入、1月からは消費税の増税に関するもろもろと並行して4月にリリースする比較的大きなプロジェクトに入って疲弊。同、7月にも似たような規模のプロジェクトに入った結果、10をmaxとしたら8からスタートしたのに4まで減って、で、6まで回復して3まで減って・・・みたいなことを繰り返した。

主なところでは年齢の影響もあると思われるが健康診断で今までひっかかっていない数値がひっかかった。というか再検査じゃなくて要治療の紹介状が来た。

また12月にはおよそ10年ぶりくらい(ちなみに当時新卒で入社した会社が(自身の環境も併せて)どうにも辛くて辞めようと思っていた時期ぶり)に喘息の発作も発生した。

その他

  • 腸閉塞の手前
  • 指への石灰沈着

など変な病気もかかった。

この年末で少しは心身ともに回復をしたいところではあるのだが、現時点ではその回復の良い方法も見つからず、ただ寝ては起きてと、むしろ自律神経をおかしな方向へと進行させている気がする。

もう、このへんに関しては美輪明宏さんのおっしゃる

「人生が上手く行かない時どうしたらいいですか?」という質問に対しての、美輪明宏さんの回答が素晴しいと話題に

品物を揃えなさい。美・知識・教養・技術、そういう自分の財産を増やしておきなさい、そういう時期

と捉えるしかないんじゃなかろうか。

あ、要するに不健康なのは忙しかったから体調を崩しましたとかそういう話じゃないってことです。ハイ。

仕事

楽しかった仕事の終わり

11月にローンチした新しいメディアが7月にクローズする。

エイプリルフール企画をはじめて会社でやったことや、ソーシャルアカウントの運用、メンバーとの関係性などが良好で、あまりここに力を入れられなかったことが残念だが楽しかったし、やってみたいと思っていたことを叶える機会があった仕事がなくなってしまった。

リーンUXはどこへ消えた?

年末くらいからリーンで開発をすることであったりとか、役割を超えた活動のやり方であったりというところをずっと考えてきて、部分的にはそれがうまくいっているところもある。しかしそうでない部分もあり、特に自分としても「もうあの人とは仕事をしたくないなあ」と思う人間を3人も作ってしまった。

また「個々の組織の総和が会社を良い方向に向けているとは思えない」印象をうける出来事があり、リアルにこの日吐き気がした。

データを解析するお仕事

データの指標を作っていこうとかそういうことは結構出来た気がするけど、1年を通してまともに解析してレポーティングして、というようなことは一回しかなかった気がする。年末から1つそのような仕事へのお誘いがあったので、2015年はまずこの仕事にどれだけ時間を割けるか、この仕事がちゃんとフィニッシュを迎えるのか、によっては会社とのつきあいかたを真剣に考えざるをえない。

解析とは直接の関係はないが、関連する知識が活かせる分野のお仕事をさせてもらえていることは、プラスに考えていきたいと思う。

エバンジェリスト

前から興味のあったこと。


エバンジェリスト養成講座(西脇資哲) | 翔泳社の本

今年はデータに関する勉強会や、リーンUXに関する勉強会、営業チームでの勉強会など、自分が良いと思ったことを他の人におすすめする、という機会が多かった。今後もこのような機会を作っていき、かつおすすめしていく中で相手の行動を変えていく方法、というのをもっと身につけていきたいと思っている。

来年ははじめのほうに、リアル脱出ゲームを活用してチームワークを高める方法、ということについて考えているので、お話をする予定でずっとどう伝えるか考えている。

プライベート

  • 妹が結婚した
  • 親戚のこどもたちとよく遊んだ
  • 6年半使ってたガラケーが死んだので本格的にスマートフォンへ変えた
    • HTML5ベースの俺得アプリをつくってみようとちょっとずつはじめた
  • 妻にとってははじめての海外旅行をした
  • 野球は監督業へのシフト。チームが初めてプレーオフに出場した

こんなかんじかな。

2015年をどういう年にするか

「やると決めてやる」、これ、割と自分の中の基本だったのだけど、ここ最近守れていない気がした。その結果外的な要因があるとはいえいろいろなことが継続できなかったので、周囲を巻き込んででも、そのことに集中してやり切る、ということで言い訳のできない状況というのを作っていかないといけないんだろうなと思う。

それとは別に趣味の話

ダンエボ DanceEvolution ARCADE
Ingress - Google Play の Android アプリ をはじめたよ。

両方共からだを動かす系に結果的になっているんだけど、これはそういう欲求なんだと思う。

はたまた別の話

四月は君の嘘


TVアニメ「四月は君の嘘」オフィシャルサイト

最近「あこがれ」が減ったんだなってことを思った。キャリアプラン的なこともそうだし、同世代の人だったり、場合によっては異性だったり、というのを、このアニメをみて感じた。
あこがれの対象に回れよ、ってハナシはもちろんそうなんだけど、そこらへん含めて「欲がなくなった」というところがあるのかもしれない。


同時に、こういう人たちのお陰でいろいろ助けられているな、というのを、直接的に助けられることとは違うやりかたで助けられているなあという意味で感じたというのもある。ひさびさに人間関係的な意味で良いアニメだった


というわけでバイオリズムの回復を待つか。

karma で テストしながらカバレッジを取る

karmaでカバレッジを取る

以前書いた記事からkarmaがバージョンアップしており、カバレッジを取得する方法が変わっていました。

カバレッジを取る方法は、preprocessorsとして定義して、その中でプラグインとしてcoverageを呼ぶ方法となっています。

このため、karmaのインストール時に、karma-coverage をインストールします。

karma-coverageのインストール

また、テストにはJasmine、ブラウザとして PhantomJSを使いたいので、以下のようにpackage.jsonを定義します。

{
  "devDependencies": {
    "karma": "~0.12.21",
    "karma-coverage": "~0.2.5",
    "karma-jasmine": "~0.1.5",
    "karma-phantomjs-launcher": "~0.1.4"
  }
}

$ npm install

いろいろなものがインストールされます。

とりあえず対象となるコードを準備

テキトウです。

src\math.js

// 絶対値取得。numが0以上ならそのまま、0以下ならマイナスをかけて返す
function abs(num) {
  if (num >= 0) {
    return num;
  } else {
    return -1 * num;
  }
}

spec\mathspec.js

describe("math suite", function() {
  it("math.abs spec when num is positive", function() {
    expect(abs(10)).toEqual(10);
  });
});

karmaを設定する

おなじみ初期化です。

$ karma init

Which testing framework do you want to use ?
Press tab to list possible options. Enter to move to the next question.
> jasmine

Do you want to use Require.js ?
This will add Require.js plugin.
Press tab to list possible options. Enter to move to the next question.
> no

Do you want to capture any browsers automatically ?
Press tab to list possible options. Enter empty string to move to the next quest
ion.
> PhantomJS
>

What is the location of your source and test files ?
You can use glob patterns, eg. "js/*.js" or "test/**/*Spec.js".
Enter empty string to move to the next question.
> src/*.js
> spec/*.js
>

Should any of the files included by the previous patterns be excluded ?
You can use glob patterns, eg. "**/*.swp".
Enter empty string to move to the next question.
>

Do you want Karma to watch all the files and run the tests on change ?
Press tab to list possible options.
> no

こんなかんじで設定。
PhantomJSの利用と、ソースファイル、テストファイルを読み込ませるだけです。



とりあえずテスト。

$ karma start

INFO [karma]: Karma v0.12.21 server started at http://localhost:9876/
INFO [launcher]: Starting browser PhantomJS
INFO [PhantomJS 1.9.7 (Windows 7)]: Connected on socket neyN1RfF24QpB3M5OJL3 with id 7600682
PhantomJS 1.9.7 (Windows 7): Executed 1 of 1 SUCCESS (0.005 secs / 0.004 secs)

OKですね。

カバレッジを取得する設定を行う

karma.conf.js を修正していきます。

カバレッジを取得するように
    reporters: ['progress', 'coverage'],
カバレッジ対象のコードを指定
    preprocessors: {
      'src/*.js' : 'coverage'
    },

再度

$ karma start

すると、coverageフォルダができます。

こんなかんじ。

└─PhantomJS 1.9.7 (Windows 7)
    │  index.html
    │  prettify.css
    │  prettify.js
    │
    └─src
            index.html
            math.js.html


中身はこんなかんじです。

f:id:kidd-number5:20140808151748p:plain
f:id:kidd-number5:20140808151755p:plain

ばっちりですね。

[python][pandas] pandasで移動平均

Rで移動平均 - tetsunosukeのnotebook を pandasで。

今回は結構簡単です。

>>> import numpy as np
>>> import pandas as pd
>>> data = np.array([1,2,3,4,5,4,3,2,1])
>>> pd.rolling_mean(data, 5)
array([ nan,  nan,  nan,  nan,  3. ,  3.6,  3.8,  3.6,  3. ])

[pandas] pandas で 回帰分析

Rで回帰分析 - tetsunosukeのnotebook を pandasでやってみた

特にファイルを読み込む部分がRっぽく書ける

import pandas as pd
>>> data = pd.read_csv("2-1.csv")
>>> data.describe()
          degree       amount
count  12.000000    12.000000
mean   16.391667  1310.833333
std     7.607587   414.355323
min     5.100000   772.000000
25%     9.725000  1127.500000
50%    16.700000  1231.000000
75%    22.750000  1355.000000
max    27.500000  2389.000000

[8 rows x 2 columns]

あとはRのnlsのように...

>>> model = pd.ols(y=data["amount"], x=data["degree"], intercept=True)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "c:\Python27\lib\site-packages\pandas\stats\interface.py", line 135, in o
ls
    return klass(**kwargs)
  File "c:\Python27\lib\site-packages\pandas\stats\ols.py", line 53, in __init__

    import scikits.statsmodels.api as sm
ImportError: No module named scikits.statsmodels.api


ols関数で回帰分析しようとしたら落ちた!

追ってみると、Patsy が入っていなかったのでインストールして再実行

>>> model

-------------------------Summary of Regression Analysis-------------------------


Formula: Y ~ <x> + <intercept>

Number of Observations:         12
Number of Degrees of Freedom:   2

R-squared:         0.6119
Adj R-squared:     0.5731

Rmse:            270.7228

F-stat (1, 10):    15.7685, p-value:     0.0026

Degrees of Freedom: model 1, resid 10

-----------------------Summary of Estimated Coefficients------------------------

      Variable       Coef    Std Err     t-stat    p-value    CI 2.5%   CI 97.5%

--------------------------------------------------------------------------------

             x    42.6066    10.7296       3.97     0.0026    21.5766    63.6365

     intercept   612.4407   192.4569       3.18     0.0098   235.2251   989.6562

---------------------------------End of Summary---------------------------------

x, interceptの値、42.6066と612.4407を得ることが出来ました。


>>> model.summary_as_matrix
                 x   intercept
beta     42.606567  612.440687
p-value   0.002639    0.009782
std err  10.729551  192.456913
t-stat    3.970955    3.182222

[4 rows x 2 columns]

beta値のところに求めたい値が出ています。

R-Style

Rっぽくモデルを書くことができるので、それを試してみます。

>>> import statsmodels.formua.api as sm
>>> res = sm.ols(formula="amount ~ degree", data=csv).fit()
>>> res.summary2()
<class 'statsmodels.iolib.summary2.Summary'>
"""
               Results: Ordinary least squares
============================================================
Model:                 OLS     AIC:                 170.2930
Dependent Variable:    amount  BIC:                 171.2628
No. Observations:      12      Log-Likelihood:      -83.146
Df Model:              1       F-statistic:         15.77
Df Residuals:          10      Prob (F-statistic):  0.00264
R-squared:             0.612   Scale:               73291.
Adj. R-squared:        0.573
------------------------------------------------------------
           Coef.   Std.Err.   t    P>|t|   [0.025    0.975]
------------------------------------------------------------
Intercept 612.4407 192.4569 3.1822 0.0098 183.6200 1041.2614
degree     42.6066  10.7296 3.9710 0.0026  18.6996   66.5135
------------------------------------------------------------
Omnibus:             4.269      Durbin-Watson:         2.667
Prob(Omnibus):       0.118      Jarque-Bera (JB):      1.424
Skew:                0.700      Prob(JB):              0.491
Kurtosis:            3.943      Condition No.:         44
============================================================

Rでカイ二乗検定 を pandas/scipy で

Rでカイ二乗検定Pythonで行います。

カイ二乗検定を行うだけであればpandasは必要なさそうです。

Rで下記のように行っていたコードを、

chisq.test(
  c(10, 10, 10, 25, 1, 4)
)


scipy.stats.chi2_contingencyに渡すために、本来同数であれば全部10回ずつになる、という仮定を並べておきます。

>>> import scipy.stats
>>> obs = np.array(10,10,10,10,10,10], [10,10,10,25,1,4)
>>> res = scipy.stats.chi2_contingency(obs)
>>> res[0:2]
(16.363636363636363, 0.005879038879660156)

p値が0.005ということになりました。

同様に

10, 10, 10,  8,  8, 14

というデータであればp値は0.95311546950018988となりました。

検定の結果としては両方共Rで実施した場合と等しくなっています。

Rでこれと同じ数字を出すためには

> m = matrix(c(10,10,10,10,10,10, 10,10,10,25,1,4),ncol=6, byrow=T)
> m
     [,1] [,2] [,3] [,4] [,5] [,6]
[1,]   10   10   10   10   10   10
[2,]   10   10   10   25    1    4
> chisq.test(m)

        Pearson's Chi-squared test

data:  m
X-squared = 16.3636, df = 5, p-value = 0.005879

このようにしないといけなかったのですね。

うどん、そば、ラーメンのケースでは

>>> scipy.stats.chi2_contingency(np.array([[1,7,3],[13,6,10]]))[0:2]
(7.5634710117468744, 0.022783116860954487)

となりRと結果が異なっています。これはR側で計算値が不正確、というメッセージのとおりだからかもしれません。

2013年を振り返る

会社のチームで、そもそも今年何したんだっけ、ってのを並べたらウンザリするほどろくな成果を出してない感じがあって、なんでだったんだろーねー。という感じ。

さて、全体としては

テスト。テスト。テスト。

結局チームでの在籍年数が一番長くなってしまったのですが、一向に技術的負債が減らないのをなんとか1日二時間残業してでもやる、というつもりで続けた。仕事がどうにもならなく忙しい時は出来なかったが、目標としてしっかり負い続けることができたのは良かった。

とはいえもとのコードに手を入れないと書けない部分などはそう簡単には手を付けられず、まあ、こうしてればよかったのに、ということのイメージが少しついたことぐらいがプラスか。

担当領域の変更

会社として新しいことをやっていくということで、リーダーからサブリーダーへ。サブリーダーというのはある意味性に合っていて、サポートをしていくということには変わりがなかったが、意志いれという部分で構想を持たなくなったのは自分としてよかったのかどうかは悩むところ。

また、新メディア、STANDS! で、マーケティング分野へ関わることになり、何かをはじめるにあたりデータの観点からどうサービスを構築するか?ということに強く関心を持ち、実業務においてもいろいろな経験することができた。これに関してはまだまだだけどとにかく経験だと思う。

データに関するお仕事

とにかくデータに関する本をいろいろ読んだ。データサイエンティストという名前のついた仕事にいろいろある中、自分の働き方にあったものがいくつか見えたので、それにデータサイエンティストという名前が不適切であったりそもそもそんな名前がクソだ的な話はいろいろあるが、職種であるかどうかも含めてここはやっていこうという気になった。

今年の冬休みの宿題はリーンアナリティクスを読むこと。
来年も事例にはいろいろ当たりたい。

健康について考え方を変える

しばらく続けていたトレーニングはやめて、もうすこし体に負担のかからないものにしようかと。
どうしても義務感から体調崩したりもしたので、無理なく続けられる何かに目を向けていきたい。
まあここは
夫婦でできるもの、というところへもシフトしたいということはあるのだけど。

趣味

今年は野球はたくさんの試合に出れるようにした。またまだ成績は良くならないけど、バッティングについてはいろいろ教えてもらってシーズン.260は打てたので及第点。守備が不安なのでなにかいい対策はないかなー。

リアル脱出ゲームについては少し慣れてきた。まあ慣れながらやっとクリアには二歩前、くらいのレベルだけど。

音ゲーは好きな曲しかしてなくて回数も少なかったからちっとも成長がないな。

2014年もやり過ぎない程度に続けたい。

2014年は

2013年少し感じたことだけど、自分が大事だと思ったことをなんとしてもやろう、という年にしたい。周りを見てもそういう人が上手くやっていたように見えた。

周りのことも大事だけど、そうでないことをしっかりやれるようにしたい。

データ運動会に行ってきた

データ運動会って?

こちらのイベントです。
http://atnd.org/event/E0019571

スポーツの秋ということで、ワタクシが見るのもやるのも大好きな野球のデータについてのアイデアソン・ハッカソンをやるということで参加してきました。

データ提供元はもちろんデータスタジアム様。

現状、プロ野球ファンは1000万人、16%くらい減っている状況で、テレビ放送が少なくなったりしている今、野球離れの進んだ若年層をターゲットにした野球を面白いと思わせ、野球市場を活性化するアプリを作ろうぜ、というテーマ。

データの可視化

データアーティスト様、アイオイクス様からも、データの可視化についての事例の紹介や、インフォグラフィックの注目度などのお話を頂きました。

データの見せ方3箇条
  • デザイン<データ の関係は崩さない : 何のデータかわかるようにする
  • データを入れすぎない
  • データは必ず信用できるものを使う

など、参考になりました。

アイデアソン

ラーニングプロセス 矢吹様、イノベーションファシリテータ・ワークショップデザイナーであるとのことで、マンダラートからはじめとして、他花受粉などのプロセスでとにかくアイデアを出しては交換し、最終的に投票で良いと思ったものをハッカソン用の元ネタとして使うということで。

個人的には、野球をどう身近にするか、ということで、イケメン度や好きになれそうな選手をレコメンドするアプリや、カードバトルなどで隠れたうんちく要素が発動(清原が泣き出して守れないとか、誰それは中学の先輩だから頭があがらないとか)するゲームとか、記録達成の日を予測してその日にスタジアムにいると記念品がもらえるとか、をアイデアとして出しました。

ハッカソン

自分が参加することになったチームは当初「監督よりも優れた采配ができるか?」というのをクイズ・投票形式にする、というアイデアでした。勝利に対しての寄与率みたいな数字がモデル化されているので、それが上下するかなどで算出できるかな?と思っていましたが、そもそも采配を当てたところで野球を見る人って楽しいのか?ということになり、再度議論した結果、一球速報に、それぞれの対戦でどちらが勝ちそうなのか?というのを判定するアプリにしました。勝ちそうな要因にパワプロなどである、特殊能力(初球・ランナー有・連発など)を可視化し、解説者がなぜ「今はバッターが有利」などというコメントをするのか、理解可能にする、という案に落ち着きました。

私以外のメンバーが統計系の大学院生だったので、モデルの作成は彼らに任せ、私はPHP+MySQL+JS+TwitterBootstrap での画面側を作りました。

下記のようなアプリができました。

f:id:kidd-number5:20131008121434p:plain

データスタジアム賞 を頂きました。実際にサービスを行っている一球速報をさらに改善できるアイデアであったということで、アイデアを練りなおして、ユーザ目線に何度も立ち返ったことが一つのポイントであったと思います。

その他のチームでは
  • ストライクゾーンの判定に偏りがあるかを調べ、審判が贔屓しているか?を調べるアプリ
  • 良妻判定 結婚した後の成績があがったかどうか、を、ピンチ・チャンス時の成績をもとにして判別
  • カープの応援であるスクワットをスマホセンサーで検知して、全国ランキングを作ったりするアプリ
  • 捕球した打球の重心からの距離、標準偏差などをもとに守備範囲を見える化する
  • 連打を浴びた、などの状態からパワプロのピヨり状態の推定
  • ストライクをボウリングと勘違いする人がいるのでそれなら対戦成績から打球の飛ぶゾーンを算出してボウリング
  • 選手の強さを定義してそれを倒した成績等から判定する隠れたお得意様を探すアプリ
  • ピタゴラス勝率などの数字から、ビール指数というビールがおいしく飲めそうな試合、タイミングを探るアプリ

上記概要だけだと工夫や面白さがちょっと伝わらないのですが、それぞれ独自の指標を作ったり、すでにある指標のビジュアル化、アプリとしてもスマホのセンサーを使ったりと、なるほどこういう着眼点で見せるというのは、同じデータを使っていてもやり方がいろいろあるのだなと、盗むべきところが多いイベントでした。
 

感想

メンバーによってアプリ屋がいなかったので、統計モデルの作成までにとどまったところや、初めてJavaScriptを書いた!みたいな人たちもいて、何かしらバランスを考えられたらよかっただろうな・・と思いつつも、それはそれで面白いかも・・・なんて。

しかし優勝したチームはアイデアソンの初日の後に飲みに行ったり、夜中まで実際に開発をしていたそうで、学生さんの若さと優秀さにただただ唖然としたし、同時に羨ましくも思いました。(おっと、学生さん以外も夜中までやっていた方がそのチームのリーダーでした。すごすぎる!)


また参加してみたいし、弊社にはスポーツ関連の写真が大量にありますので、これらを使ったハッカソンなどもご提供できると思います!


当日のイベントがNHKさんのニュースになっていました。
http://www3.nhk.or.jp/news/html/20131007/k10015088001000.html