最新ニュースから話題の画像まで2ちゃんねるまとめならここで!


生物学の主流はビッグデータ、Pythonが必須スキルな時代に

   

python

いまや生物学の主流はビッグデータであり、プログラミングは生物学者に必須のスキルとなったという。

ナムラター・ウデシは、ヒト細胞のプロテオーム解析(プロテオミクス)の手法に精通している。プロテオーム解析とは何なのか、なぜそれが重要なのか、読者にはさっぱりわからないとしても無理もない。大学院で何年も経験を積んでようやく習得できる、複雑な研究手法なのだ。とりあえずいまは、疾病研究に重要な手法だということを覚えておいてほしい。

ブロード研究所のプロテオミクス研究室グループリーダーであるウデシは、複雑な細胞機能の謎を解明すべく日夜研究に励んでいる。さらに彼女は幼い2児の母でもあり、自由時間はまったくないに等しい。

それでもなお、彼女は毎日数時間かけてプログラミング言語「Python」を学んでいる。

「博士研究員として働き始めて以来ずっと、データ解析を自動化できたらいいなと思っていたんです。でも、わたしにはプログラミングの知識がなかったので、詳しい人を探し出しては協力をお願いしていました」と、ウデシは言う。しかし、このやり方は手間がかかるし、限界がある。それゆえ彼女は現在、ハーヴァード・エクステンションスクールでプログラミングの初級講座を受講しているのだ。ウデシだけではない。ボストンでブランチをとっていた生物系の博士研究員数人に、プログラミングの勉強をしているか尋ねてみたところ、全員がイエスと答えたのだ。生物学者に必須の要素がカリキュラムから欠落していることを全員が認識し、彼らはそれを自力で補おうとしているのだ。

そんな時代になったのか、と驚かされる。いまや生物学の主流はビッグデータだ。生物学者は研究室に通いつめ、生命体からデータを引き出す。「CRISPR-Cas9[日本語版記事]」のような新たな研究ツールの登場により、ますますデータは増える一方だ。ウデシも以前はExcelで自分の研究データを管理していたが、ここ5年でデータセットは急激に巨大化した。「1万5,000件のデータポイントを手作業で確認するなんて、もはや不可能なのです」と彼女は言う。すべてを分析するためには、生物学者は自分の実験にあわせたプログラムを自分で書くしかない。

http://wired.jp/2017/05/11/biologists-teaching-code/

3:名刺は切らしておりまして 2017/05/12(金) 09:36:20.65 ID:xRc4mpzT.net

Phythonを使う前にやることがあるだろう
ただPhythonでは限界がある

5:名刺は切らしておりまして 2017/05/12(金) 09:38:04.74 ID:Yt7leVTE.net

>>3
知ったか乙

ライブラリが豊富だから需要あるんだよ

13:名刺は切らしておりまして 2017/05/12(金) 09:55:43.10 ID:TICXLTbF.net

>>3
言語名を全角で書くような奴が言っても説得力ゼロ

16:名刺は切らしておりまして 2017/05/12(金) 10:22:12.73 ID:jb1BGhnI.net

>>3
Phython っていう言語があるんだよ、きっと
俺らの知ってる Python とは別の

34:名刺は切らしておりまして 2017/05/12(金) 15:01:58.48 ID:K/oy0Yvw.net

おれちっちゃい頃 python をピトホンって読んでた

6:名刺は切らしておりまして 2017/05/12(金) 09:41:41.47 ID:OtoKdP9Z.net

マジだよ
最先端のバイオロジーは今や殆どデータサイエンスと化した
Rとかシェルとか使いこなせないと話にならん

9:名刺は切らしておりまして 2017/05/12(金) 09:46:33.81 ID:Yt7leVTE.net

>>6
R使いは重宝されるよ

データサイエンスの世界において、Pythonから入った人はプログラミングはできても計算に疎い

Rの人はそのあたりしっかりしてるから

26:名刺は切らしておりまして 2017/05/12(金) 12:53:46.27 ID:MufkblfR.net

>>9
Rできるけど研究室の事情でクビになったw

10:名刺は切らしておりまして 2017/05/12(金) 09:49:52.59 ID:gpuoCYLw.net

全部最初から最後まで人工知能にやらせた方が速そうだが

12:名刺は切らしておりまして 2017/05/12(金) 09:54:11.21 ID:pmwRG7Yo.net

>>10
そのうちそうなるだろうね
最初からというか、人工知能への目的の伝え方のコツが学者のスキルになる

4:名刺は切らしておりまして 2017/05/12(金) 09:37:04.72 ID:caRPX+yk.net

もうしばらくするとプログラミングは必修科目ではなくなって
さらにもうしばらくすると生物学者が必要なくなりそう

11:名刺は切らしておりまして 2017/05/12(金) 09:51:04.81 ID:xi88wn3f.net

けっきょくネットワークに翻弄されてるだけだよね。

14:名刺は切らしておりまして 2017/05/12(金) 10:12:36.88 ID:tv2u37Vn.net

自然界との フラクタルでマンデルブローな相似

17:名刺は切らしておりまして 2017/05/12(金) 10:24:07.85 ID:e4VnJQKI.net

日本のプログラムなら格安の月十数万の使いたい&使い捨て放題で雇えるのに。

20:名刺は切らしておりまして 2017/05/12(金) 11:11:38.29 ID:a/CODIN0.net

>>17
役に立たないけどね。
英語が通じないし。

24:名刺は切らしておりまして 2017/05/12(金) 12:20:06.42 ID:FSAiPMWj.net

生物系というかバイオインフォマティクス関係だろう
ピペドは相変わらず肉体労働

50:名刺は切らしておりまして 2017/05/12(金) 16:22:17.08 ID:SIJtgr4f.net

>>24
バイオインファマティクスは更にMatlabも必要だぞ
これは実験解析が多目な実験ラボだな

25:名刺は切らしておりまして 2017/05/12(金) 12:35:35.85 ID:FEy//OS6.net

大人になってからのプログラミングだと最先端を切り開くネイティブプログラマーには逆立ちしても勝てないし、かといってそういった宇宙人はアスペ気質の過集中が多いので結局は自分の分野は自分でとなるのか・・・。

27:名刺は切らしておりまして 2017/05/12(金) 13:01:01.02 ID:a/CODIN0.net

>>25
というか、コンピュータサイエンスについては知識や経験が豊富な凄腕プログラマでも
バイオインフォマティクスについての知識を持って無いのが普通だから、
やりたいことを伝えるのに手間がかかるってことだろう。

29:名刺は切らしておりまして 2017/05/12(金) 13:20:39.97 ID:La7e5A45.net

俺は中学生の頃からC/C++やって、今は研究者やってるけど、
大人になってから必要になって始める人はRとかPythonとかから始めるから、
どうしても基礎力が身につかない。回り道でもCからやったほうがいい。

31:名刺は切らしておりまして 2017/05/12(金) 14:39:18.42 ID:164CnQGp.net

>>29
バカだなお前

プログラミングすること自体が目的ではなく
pandas, scipy, scikit-learn, matlibplotを
使ってデータ分析することが目的なんだ

そういうライブラリに入ってる関数を
C/C++のプリミティブな記述で自分で書くなんて
車輪の再発明、バカのすることだ

32:名刺は切らしておりまして 2017/05/12(金) 14:49:56.00 ID:IQujAZUo.net

>>31
それだとライブラリに入ってるものしか使えないよ。
自分でコード書けたり修正できればそれ以上のことができる。

例えば、あるアルゴリズムで解析したい。
そのコードは論文の著者がMATLABスクリプトで公開している。
しかしコードは若干のバグがあり、そのままではエラーが出る。
あと、高速化のために並列化するように拡張したい。

こういうケースはざらなんだよ。
そこでできるかできないかで研究のクオリティが変わってくる。

37:名刺は切らしておりまして 2017/05/12(金) 15:12:12.40 ID:OxENZ0NR.net

>>32
分かってないな

ライブラリは最新の計算技法の集大成であり、
それぞれの学問分野でみんなが使う基礎的なものが
これでもか!ってなくらいに多数、様々にあり、
世界中の研究者が愛用し、テスト、デバッグされている

それらを組み合わせた1つ上の階層で
自分独自のアルゴリズムを構築するんだ

例えば、バイナリサーチを自分で組むのは
今の時代、馬鹿のすることだろ?

scipyにはもっと高度な方程式求解のクラスオブジェクトが入ってるんだから、
方程式の解を求めること自体はそれをそのまま使い、
その解が何を示しているか?
その利用価値を考えることに時間を費やすべきだ

プリミティブなプログラミングテクニックなんて今の時代じゃ必要ないんだよ

38:名刺は切らしておりまして 2017/05/12(金) 15:17:48.40 ID:IQujAZUo.net

>>37
別にそれらをCで自分で実装しろとは言ってないでしょ。
しかしなんでもライブラリの関数呼び出せば済むというものでもない。

新しいアルゴリズムだと利用者なんて少ないぞ。
1~2年前に論文で発表されてコードは公開されているが誰も使ってないとかよくある。
誰かが書いたライブラリ使う場合でも自分がデバッガやるようなもんだ。
そこで大事になるのがCやC++をやることで養われる基礎力だ。

40:名刺は切らしておりまして 2017/05/12(金) 15:32:06.51 ID:V/UuKTbC.net

Cをやるべきだって意見も
Pythonで充分って意見も
どっちの考え方もあるだろうな
使いたいソフトがあって、データがあって、手作業でそれにかけてもいいっちゃいいけど、そこを自動化したい
そういうつなぎの部分をやるだけならPythonでもいいだろうし
それよりももう少し深いこと、新規のアルゴリズム、高速アルゴリズムを自分で生み出したい
みたいな場合は高速化のための知識とかあったほうがいいだろうし
そこは立ち位置の違いによっていろいろじゃないのかな

54:名刺は切らしておりまして 2017/05/12(金) 16:37:51.86 ID:vlT2neiZ.net

>>40

PhythonのライブラリはC言語で書けて
呼び出して使える。 だから、既存のライブラリに
無くて、学者の仮説に合わせた計算アルゴリズムは
C言語で書ければ凄く研究活動に寄与するわ。

この辺を専門のPGに任せれば良いのだが、時間短縮の
ためには自分で書ければ人の先を行ける。

59:名刺は切らしておりまして 2017/05/12(金) 18:39:09.35 ID:oMO1yRKs.net

>>54
大抵はNumpyの配列演算で十分高速だと思うけどねわざわざCで書かなくても

44:名刺は切らしておりまして 2017/05/12(金) 15:51:37.97 ID:BRc2MSFq.net

Pythonのおかげで驚くほどプログミングの閾値が下がったね。
研究開発に従事している人は使えたほうがいいよ。

51:名刺は切らしておりまして 2017/05/12(金) 16:22:22.18 ID:Hy4hSKAs.net

多量のデータ処理で研究分野ならpythonは有力な選択肢だろ。ビックデータと相性が良くライブラリも文献も豊富。日本では今一人気無いのが勿体無い。

今後もデータは増える一方だしデータサイエンスは基礎学問になっていきそうだな。

53:名刺は切らしておりまして 2017/05/12(金) 16:33:50.05 ID:pkmFjvhU.net

昔数理生物学をやってたけどUNIXでCを使ってプログラムして計算機シミュレーションしてたわ
生物系の研究者ってプログラムできる人がほとんどいないんだよね
某医大の教授なんかはプログラムできないから非線形微分方程式を数列でエクセル使って必死こいて計算してたわ

55:名刺は切らしておりまして 2017/05/12(金) 17:08:01.51 ID:5L0GmSEE.net

物理系の人は随分前から自分でやってたよね。
大型計算機を二月待で一月かけて計算する時代が、パソコンで1時間で出来るのが感激だったとか。
今60くらいの人はそんな感じ。
生物系の人で、30年くらい前の情報処理1種を研究の片手間に勉強して取ったって人いたな。

60:名刺は切らしておりまして 2017/05/12(金) 19:05:41.30 ID:BRc2MSFq.net

Pythonで充分だよ。
コーディングにかかる時間が圧倒的に短いし。
計算時間だってnumpy使えば実用上問題ないよ。

物理系シミュレーションもComsolのPDEソルバー使えば大抵なんとかなるから、
自分でコード書くのは計算後のデータ処理とかだね。

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

斎藤 康毅
オライリージャパン
売り上げランキング: 76

元スレ: http://anago.2ch.sc/test/read.cgi/bizplus/1494548681/

Python

Copyright © 2017 まとめるクローンX All Rights Reserved.


 - その他

Fate/Grand Order ID交換掲示板
セブンナイツ フレンド募集掲示板