カイヤン雑記帳

カイヤンがやったことを書いておいたり、ぼやきたいことを書き込んだりする場所

IQが1のデータ分析:respects いつも何度でも尋ねられること

おはようございますまたはこんにちはまたはこんばんは,カイヤンです.

復活宣言からの1か月休刊という体たらく.うーんこの.

今回はIQ1AdCの12月11日担当記事を書きます.

過去には多少真面目なアドベントカレンダーをやっていましたが[1][2],今回は残念な感じで行きます.社会に出てIQが1になってしまったので.

IQが1なので,カゲキなことが書いてあるかもしれないっぽい~*1

IQが1のデータ分析

IQが1になったので,データ分析にあたって考えるようになったことをまとめます.

これは,IQが1の考えです.

ただし,注釈中ではIQが1じゃないかもしれませんし,やっぱりIQが1かもしれません.

データ編

まずデータが与えられるところからデータ分析は始まります.計画? そんなものはない*2. あと,汚いデータなんて送ってこないでください.IQが1なのでそんなものをもらっても疲弊するだけです*3.まあ欠損値なんてテキトーに除去すればいいんですがね*4

モデリング

時代はコネクショニズム! データをディープなニューラルネットワークにとりあえず突っ込めば自動的によしなにやってくれるんだ*5!  いやーIQ1にも優しい時代になりました*6

さて,データはたくさんある.ない場合はデータ分析なんかできません*7.たくさんあるので,このデータに合うモデルを作ればデータを発生している分布に適合するはずだ*8!  データは多い方が賢い人工知能を作れるんだから,手元のデータは全部学習に使おう*9

……できた! よし,損失函数は寝そべった*10し,確かに精度がほぼ100%だ*11! やっぱり時代はディープラーニング!! ディープラーニングが,ディープラーニングこそが絶対的に正しい統計的推論なんだ*12!!!! 最近収束も証明されたし*13,これまでの方法はみんな淘汰される*14!!!!

IQが1のデータ分析まとめ

以上,IQ1のデータ分析を見ていきました.いやあIQ1に優しい時代になりましたね.絶対的に正しい推論によってすべてのデータ分析の問題が(データと計算資源さえあれば)解けてしまうわけですから!

え? 注釈? 守旧派のディープヘイトがなんか言ってるだけ*15ですよあんなの.気にしない気にしない,既得権益にしがみついてるだけの,考え方が古い人の言うことなんか聞くだけ時間の無駄.決定論者には見えないものの方が多い*16し,ベイズ推論は推論結果を事後分布*17とか言ってごまかしている詐欺師*18でしかない.ベイズ理論の論文なぞ,気高き特異点論と主流からそれたナンセンスの紙切れだ*19.そもそもディープが正しいんだからこんなのに構っているのは老害よ.

*1:内輪ネタ.このAdCの主催が某これの某駆逐艦が好きでよく言っているので.

*2:基本的には,何か仮説を検証するためにデータを取ってくることが重要です.なんか最近はとりあえず集めたデータから何か言えないかって話も多いようですが

*3:前処理から推論は始まっています.

*4:欠損値を除去するととてもデータが偏ります.補完しましょう.補完方法は今日もいろいろ研究されています.古典的かつ有効なものとしては多重代入法が挙げられます.

*5:データが得られている分野の知識=ドメイン知識を考慮せず,簡単なモデルでデータの様子を見ることもなくいきなり深層神経回路網に突っ込んでも得られるのは虚無です.

*6:手法が増えた分むしろ厳しい時代になったと思います.

*7:さほど多くない場合がむしろ多いんだよなあ…….

*8:過学習まっしぐら.

*9:それで手元にないデータにそのモデルが合うことは納品前にどうやって確かめるんですか?

*10:訓練損失が寝そべりきってしまいましたかそうですか

*11:そりゃあ学習データで評価したらそうでしょうよ

*12:正しい統計的推論は存在しません.不良設定問題って知ってる?

*13:急にIQが上がっているように見えますが,収束と汎化は違うのでやはりIQ1です.

*14:絶対的に正しい統計的推論があると信じ,他の方法はなくなるというのは20世紀初頭の人と同レベルの考え方です.

*15:まともな研究にもあーだこーだ言う無知な癖ネガキャンだけは一丁前な人がいるのは事実だがこれは果たして…….

*16:これは一定ラインまでは正しいが,決定論的に解ける問題をわざわざ学習で解くのは…….

*17:予測分布を出していない,-114514点.

*18:これもうどっちが頭古典派かわかんねえな.

*19:IQ1だけでなく,VC理論やAllen理論・収束レートの研究をしているNIPSifiedされた人たちのごくごく一部にはそう見えるらしいです.主な研究拠点が日本でトップの国際会議で見当たらないかららしいよ.知らんけど

続きを読む

IBIS2018参加記録

はじめに

これは第21回情報論的学習理論 (IBIS) ワークショップ,通称IBIS2018の参加記録です.

あとで成型するかもしれませんが,取り急ぎ聴講メモを公開します.

これはカイヤンが感じとったメモであるため,大いに間違っている可能性があります.

続きを読む

ベイズ統計学の逆温度パラメータ

おはようございますまたはこんにちはまたはこんばんは,カイヤンです.

就活エントリーが有名な方に捕捉されたりものすごくバズったりと過分な評価をいただいており,とても驚いているこの頃です.

私や私のドクトリンが評価されているのではなく,記事から就活最前線の様子を推測しやすいからこれだけ評価をいただいているに過ぎないと肝に銘じて思い上がらぬよう過ごしたいです *1

さて,今回はPeingに届いた質問に関して短く書いてみようと思います.

ベイズ推定における逆温度パラメータって具体的に何を制御しているものですか?(最尤法とのつながりなどでよく出てきま | Peing -質問箱-

という質問をいただきました.

質問箱では簡単に答えていますが,もう少し語らせてください.

*1:このブログの閲覧数なんて1日50も行けば多い方なのに落ち着き気味の週明け29日ですら300超でピークは2000弱とか興奮せざるを得なかった.

続きを読む