データサイエンスをやりたいのなら、「Jupyter」に詳しくならなければならない。Jupyterは非常に高い人気を誇るオープンソースプロジェクトであり、「Jupyter Notebook」で最もよく知られている。データサイエンティストはこのウェブアプリケーションを使用して、ライブコード、数式、視覚化、説明文を含むドキュメントを作成し、共有できる。これは、コードによってデータを抽出し、他のデータサイエンティストと共同作業をする優れた方法であることが実証されている。Jupyterの使用は急増し、Notebookの数は2015年の約20万件から何倍にも増加した。
Jupyterは極めて重要であり、GoogleやBloombergなど、さまざまな企業で多用されているが、最初からそうだったわけではない。Jupyterの始まりは友情だった。Fernando Perez氏とBrian Granger氏は、コロラド大学ボルダー校の大学院の入学初日に出会った。それから何年も後の2004年、2人はPerez氏が2001年に着手した「IPython」向けにウェブベースのノートブックインターフェースを作成するというアイデアについて話し合った。これがJupyterになったが、両氏は当時でさえ、Jupyterが学界の内外に大きな影響を及ぼすとは思ってもいなかった。両氏が気にかけていたのは、「計算物理学に携わる学生たちがすぐに利用できるようにする」ことだけだった、とGranger氏は指摘する。
こういったことには時間がかかる
現在、Perez氏はカリフォルニア大学バークレー校の教授であり、Granger氏はAWSのプリンシパルだが、2004年の時点では、Perez氏はコロラド大学ボルダー校の応用数学博士課程の学生であり、Granger氏はサンタクララ大学物理学部の新任教授だった。先述のように、両氏は学生だった1996年に出会い、それぞれ忙しい日々を過ごしていた。おそらく、Jupyterの誕生と最も関係があるのは、Perez氏が2001年に「Python」に手を出したことだろう。同氏は「論文先延ばしプロジェクト」と名付けた取り組みの中で、6週間をかけて最初のIPythonを作成した。この259行のスクリプトは現在、GitHubで公開されている(「自動履歴機能を備えた対話型実行で、『Mathematica』のプロンプトシステムの再現を試みる」)。
残り本文:約2133文字 ログインして続きを読んでください。