はじめての環境DNA
研究室から現場まで、実践で使える知識を!

データ解析環境の構築

環境DNAの分析にで得られるデータのほとんどは、フリーのソフトウェアで解析することができます。ということは誰でも気軽に取り組み始めることができるということです。

ここではソフトやスクリプトを動かすための簡単な環境構築についてまとめていきます。

解析するための環境を構築して、解析のはじめは見様見真似で動かしてみて、そこから数値や設定を変えたりして各パートの役割を理解していくやり方がいいでしょう。

(足りない情報や欲しい情報がありましたらコメントください。時間がある時に取り組んでみます)

[rtoc_mokuji title="この記事の内容" title_display="left" heading="h3" list_h2_type="round" list_h3_type="number1" display="open" frame_design="frame2" animation=""]

はじめに

動作環境は基本的にWindowsです。

解析の解説記事ではシェルスクリプトを常用しているので、コマンドプロンプトでは動かないコマンドも出てくるかもしれません。

Windowsを使用されている場合は下記手順に従い、WSL(Windows Subsystem for Linux)の有効化とMicrosoft StoreからUbuntuをインストールするのがいいでしょう。

Windowsで動かせないけどどうしても使いたいソフトがある!という場合は仮想のLinux環境を構築したり、ラズパイなど使って動かしてみると安価に解析できるかと思います。

表記ルール

コマンドラインでのコマンドの表記

以下のように$から始まるものはshellスクリプトで、#はコメント行です。コマンドをubuntuにコピペする場合は、$より後ろをコピーして右クリックでペーストします。

ubuntu上で上記の$を抜いたコードを実行してみてください。

実行する今開いているフォルダ(カレントディレクトリ)内にあるファイルやフォルダが一覧で表示されるはずです。

出力結果

出力結果がないとうまくいっているのか分かりにくいです。ここでは可能な限り下記のような出力結果を掲載するようにします。

Rでのコマンドの表記

Rのコマンドは以下のように表現します。#はコメント行なのでスクリプトに記入しても実行されません。

出力結果

Rについてもコマンドラインの結果と同様に、R studioのコンソール画面の出力結果を掲載するようにします。

準備 コマンドライン編

WSL (Windows subsystem for Linux)の有効化

シェルスクリプトをwindowsで動かすために、確認・変更すべき設定があります。

それは、"Linux用Windowsサブシステム"と"仮想マシンプラットフォーム"を有効化することです。

有効化はWindowsの機能を起動し、チェックマークが入っていなければチェックを入れて再起動するだけです。

1. 左下のスタートボタンを右クリックして”アプリと機能”を選択

2. 右端の”プログラムと機能”を選択

3. 左端の”Windowsの機能の有効化または無効化を選択

4. "Linux用Windowsサブシステム"と"仮想マシンプラットフォーム"にチェックを入れて再起動(オレンジの部分)

Windowsの機能

参考: http://www.aise.ics.saitama-u.ac.jp/~gotoh/HowToEnableWSL.html

Ubuntuのインストール

1. 左下のスタートメニューの候補からMicrosoft store移動

2. ubuntuと検索してUbuntu 20.04 LTSをWindowsアプリとしてインストール

3. インストールされたらスタートメニューから起動します

4. 半角英数字でユーザー名とパスワードを記入
 ※パスワードは記入しても表示されません。

5.パッケージ一覧を更新

6. パッケージを更新 (時間がかかります)


参考: http://www.aise.ics.saitama-u.ac.jp/~gotoh/HowToInstallUbuntu1804OnWSL.html
(ターミナルサイズの変更の前の項まででOK)

python

準備中

準備 R編

Rのインストール

RのHPから最新バージョンをダウンロードします。Rはバージョン4.0以降とそれより前とでは仕様が大きく異なるようなので注意してください。

左側のCRANをクリック
Japanを探して、東京か山形大学のどちらかをクリック
Download R for Windowsをクリック
baseをクリック
Download R 4.0.3 for Windowsをクリック(2020/10/26現在)

R-4.0.3-win.exeファイルはダウンロードフォルダにでも入れて、ダブルクリックで実行しましょう。

デバイス変更の許可が出るので、許可します。

言語は”日本語”を選択して、規約を読んでから次へ。

インストール先はCドライブ上のプログラムファイルに生成されるRフォルダでいいと思います。要はそのまま”次へ”ですね。

コンポーネントの選択は自身のPCに合わせたものを選択してもいいですし、そのままでも問題ないと思います。起動時オプションはそのままでいいでしょう。

インストールされたらデスクトップ上に生成されるショートカットの名前を記入します。あとでR studioを入れて、R studioからRを起動するので私はショートカットを作成しませんでした。

今まで選択してきた項目に加えて、アプリの設定などについて✓を入れます。

参考:https://qiita.com/FukuharaYohei/items/8e0ddd0af11132031355

R studioのインストール

Rのセットアップが終わったら、次はRstudioをダウンロードします。

ここからRstudioのダウンロードページへ行き、Rstudio Desktopのフリーバージョンをダウンロードします。

10/27現在 バージョン 1.3.1093

ファイルはまた、ダウンロードフォルダに保存して、ダブルクリックで開いてからセットアップを進めます。セットアップ時デスクトップ上に生成されるショートカットからR studioを起動します。

下の画像はカスタムしているので見た目は異なりますが、同様のレイアウトになっていると思います。

R studioの4つの窓の役割はこのような感じです。

好みの問題ですがカラーテーマを変えると見やすくなると思います。

私は白より黒の方が好きなのでは見にくいので、黒ベースの設定にして文字の大きさ、フォント、エンコードも変えてます。

Tools > Global Option > Appearanceで下記のように記述すると、黒ベースの画面になります。

エンコードはUTF-8を選択します。Tools > Global Option > CodeのDefault text encodingをUTF-8に。

Rの動かし方

ここから実際にRを動かしていきます。Rのコマンドを作動させるには、コマンドをRのスクリプトファイル(デフォルトで左上の窓)に記載して、記入したコマンド部分でControl + Enterを同時押しするか、左下のコンソール画面にコマンドを書き込んで、同じくControl + Enterを同時押しします。

前者は書いたコマンドが残りますが、後者はプログラムが進むとどんどん流れて行ってしまうので、基本的にはスクリプトファイルにコマンドを記載して、作動させるのがいいでしょう。

下記のように記載して、Control + Enterを同時押しすると左下のコンソール画面にHelloと表示されます。以下、この要領で記入したスクリプトを動かしていきます

仮想マシンの設定

Virtual BoxへのXubuntu LTSのインストール

VirtualBoxとは

VirtualBoxはWindows OSのパソコンでLinuxを使えるようにしたり、Mac OSでWindowsを使えるようにしたりできる仮想の環境を構築するソフトのことです。

時々、必要になることがあるので、環境構築についてここにまとめます。

ちなみに筆者はドライ解析が専門ではないので、勉強しながら記事を書いています。ご承知ください。

VirtualBoxが出来ることや良い点

仮想環境マシンを使うにあたり感じる利点は以下の通りです。

  1. ホストOSとゲストOSで同時に作業ができる
  2. 環境の構築と破棄が楽
  3. そのOSでしか動かせないソフトを動かすことが出来る

VirtualBoxの特徴は以下の通りです。

  1. ホストOSとゲストOSでフォルダを共有できる
  2. クリップボードが共有できる(OS間でコピペが出来る)

もし、自分のPCで使えないソフトがあれば導入してみる価値があるということですね。

VirtualBoxにLinuxディストリビューションを導入する際の注意点

導入するLinuxディストリビューションによっては、CPUが処理を行ったり、画面上にデータを表示したりするメインメモリ(RAM: Random Access Memory) の使用量が大きいものがあるようです。

XubuntuはUbuntuと比べるとスペックが高くないPCでも動作が軽いらしいので今回はそちらを導入します。

VirtualBoxのインストール

実際にVirtualBoxをインストールしてみましょう。

Oracle VirtualBox https://www.virtualbox.org/

公式のダウンロードサイトから自分のOSに合うインストーラーを選びダウンロードします。

  • Windows hosts
  • OS X hosts
  • Linux distributions

この記事では、Windows向けの "Windows hosts" を選択します

クリックするとインストーラー(.exe)のダウンロードが始まります。

何も指定していなければ、ダウンロードフォルダにダウンロードされているはずです。完了したらダブルクリックして起動します。

インストーラーを起動

Nextを押して次に進みます。

インストールする内容をカスタマイズしたりできるみたいですが、ここは初期設定のままNextを押して次に進みます。

各チェックボックスは以下の場所にショートカットを作成するかどうかと、仮想ファイル(.vbox)の関連付けについてです。

  • スタートメニュー
  • デスクトップ
  • ツールバー?

要らなかったショートカットは後で消せばいいので、とりあえずそのままNextで次に進みます。

インストール中に一時的にネットワークの接続が切れるかもしれないという警告です。不都合が無ければYesで次へ進みます。

ここまで来たらあとは Install をクリックしてインストールを開始します。

インストール中
インストール完了

Start Oracle VM ...のチェックボックスをそのままにしておくと終了後に自動的にVirtualBoxが起動します。Finishを押して進みましょう。

Xubuntuのデスクトップイメージファイルのダウンロード

xubuntu https://xubuntu.org/

ここからXubuntuのHPに移行して、Download をクリック

ダウンロードページに移行したら最新版のデスクトップイメージファイルのあるミラーサイトに移動します。

2021年1月現在の最新版はXubuntu LTS 20.04, Focal Fossaです。LTSはLong Term Supportの略です。

Mirror downloadsの項目の Japan を選択します。

ページ中段にあるxubuntu-20.04.1-desktop-amd64.isoをクリックしてデスクトップのイメージファイルをダウンロードします。

1.6GBあるので気長に待ちましょう。また、従量制課金接続の方は通信料金に気をつけましょう。

isoファイルがダウンロード出来たらcドライブ上のProgram Files(x86)にxubuntuというフォルダを作ってその中にisoファイルを入れておいてください。

VirtualBoxを起動させます。

上段の "新規" をクリックします。開いたダイアログボックス内で作成する仮想マシンの名前とインストールする予定のOSを選択して、"次へ"をクリックします。

私のホストPCは8GBメモリなので最大値が8*1024=8192MBになっています。ここは後で変えられるので、1024MBのまま"次へ"をクリックして進みます。

仮想ディスク作成の有無を指定します。ハードディスクはいるので、"仮想ハードディスクを作成する"を選択して、"作成"をクリックします。

仮想ディスクのファイルタイプを指定します。特別な要件が無い限り、virtualboxの形式であるVDIを選択します。

次に仮想ディスクのストレージタイプを選択します。

可変サイズ固定サイズとありますが、以下のような特徴があります。

  • 可変サイズ
    設定したサイズの仮想ディスクが即座にホストOSのハードディスクに適用されるのではなく、使用した分だけホストOSのハードディスクを使用する。
  • 固定サイズ
    設定したサイズの仮想ディスクがホストOSのハードディスクに適用される。

10GBがデフォルトのサイズになっています。

後々、ストレージの量を大きくするのはちょっと面倒なので、ここは大きめにとっておいた方がいいです。

VirtualBoxの起動画面には、作成した仮想マシンがリストに表示されていると思います。

Xubuntu 20.04 LTS のインストール

仮想CDドライブにXubuntu 20.04 LTSインストール用のCDイメージをセットして、仮想マシンを起動することでインストールが始まります。

ストレージをクリックして、コントローラーIDEの "空" をクリック。IDEセカンダリマスター横のCDマークをクリックします。

仮想光学ディスクの選択/作成をクリック、追加をクリックして、先ほどCドライブに移動させたxubuntu-20.04.1-desktop-amd64.isoを選択して、選択をクリックします。

最後にOKを押して準備は完了です。

VirtualBoxによるxubuntuの起動と設定

左の仮想マシンをダブルクリックして起動させます。

少し待機するとXubuntuのインストーラーが起動します。最初は英語になっているので、日本語がいい場合は言語一覧から日本語を選択します。

その後、右側のXubuntuをインストールをクリックします。

使用しているキーボードを選択します。キーボードレイアウトを検出をクリックして、指示に従ってキーを押していくと自動で選択してくれます。

英字キーボードの場合は"English(US)"、一般的なキーボードなら"日本語"になるので、合うものを選択して"続ける"をクリックします。

アップデートとその他のソフトウェアは、"Xubuntuのインストール中にアップデートをダウンロードする"を選択します。次に"続ける"をクリックします。

少し待つと"インストールの種類"という項目に移ります。

"ディスクを削除してXubuntuをインストール"を選択して、インストールをクリックします。

確認されますが、気にせず続けます。

続いて、地域を選択します。日本であれば"Tokyo"を選択して、"続ける"をクリックします。

アカウント情報とコンピューターの情報を入力します。すべて半角英数字で記入することをお勧めします。記入し終わったら"続ける"をクリックします。

インストールは少し時間がかかります。

※ストレージの容量を大きく設定しすぎた場合以下のようなエラーが出るみたいです。

インストールが終了したら、再起動を求められるので"今すぐ再起動する"をクリックして、仮想環境システムを再起動します。

再起動するとアカウントの選択画面が表示されるので、先ほど設定したパスワードを入力します。

これで、VirtualBoxへのXubuntuのインストールは完了です。

参考:https://unofficialtokyo.com/2018/12/virtualbox-ubuntu1804-on-windows/

解析ソフトの導入

BLAST+

Local環境でBLAST検索ができるようにします。

うまくインストールされているか確認します。

画像はまた後で貼ります。

動作環境

  • Windows 10 Home
  • WSL (Windows subsystem for Linux)
  • Ubuntu 20.04 LTS
  • python 3.8.5
  • ActivePerl 5.24.3 (windowsでperlを動かすために使用)
  • R 4.0.3
  • VirtualBox 6.1
  • Xubuntu 20.04 LTS

2020/12/30 時点

免責事項

十分注意は払っていますが、本記事の情報・内容について保証されるものではありません。本記事の利用や閲覧によって生じたいかなる損害について責任を負いません。また、本記事の情報は予告なく変更される場合がありますので、ご理解くださいますようお願いします。