fastqファイル(配列データ)からマニュフェストファイルを作成し,Qiime2にデータをインポートする方法を解説します。
本記事では,前回作成した水棲昆虫の配列データを使って手順を解説します。
私の解析環境
使用機器:MacBook Pro 14インチ (2023)
チップ:Apple M2 Pro
メモリ:32GB
macOS:Sonoma 14.4.1
データ整理用のフォルダの作成
はじめに下記コマンドでデータ整理用のフォルダを作成しておきます。作成したフォルダ内で解析を進めていきます。
今回はデスクトップ上に「MtInsects」フォルダを作成します。
mkdir -p /Users/user/Desktop/MtInsects/01qiime2/00Rawdata /Users/user/Desktop/MtInsects/01qiime2/01output/qza /Users/user/Desktop/MtInsects/01qiime2/01output/qzv /Users/user/Desktop/MtInsects/01qiime2/01output/other /Users/user/Desktop/MtInsects/01qiime2/02ref /Users/user/Desktop/MtInsects/01qiime2/03log /Users/user/Desktop/MtInsects/02blast/01blastres /Users/user/Desktop/MtInsects/02blast/02taxid_list /Users/user/Desktop/MtInsects/02blast/03taxonkit
次に,作成した00Rawsataフォルダ(/Users/user/Desktop/MtInsects/01qiime2/00Rawdata)に前回記事で作成した水棲昆虫の配列データを移動させます。
mv /Users/user/Users/user/Downloads/00fastqgz/*.fastq.gz /Users/user/Desktop/MtInsects/01qiime2/00Rawdata
SeqFuパッケージのインストール
配列データをQiime2にインポートするためにマニュフェストファイルを作成します。
マニュフェストファイルはSeqFuパッケージを使用することで簡単に作成することができます。
下記の手順でSeqFuパッケージをインストールします。
1. 下記コマンドでQiime2を起動します。
conda activate qiime2-amplicon-2024.2
2. 公式のGitHubサイトに従って,下記コマンドでSeqFuパッケージをインストールします。
conda install -y -c conda-forge -c bioconda "seqfu>1.10"
Terminal上に以下のように表示されればインストール完了です。
Terminal画面
Downloading and Extracting Packages:
Preparing transaction: done
Verifying transaction: done
Executing transaction: done
3. 下記コマンドでSeqFuの動作確認を行います。
seqfu -h
特にエラーが出なければOKです。
マニュフェストファイルの作成
00Rawsataフォルダに移動させた配列データをQiime2にインポートするためにマニュフェストファイルを作成します。
他の方法でもマニュフェストファイルを作成できますが,今回は簡便なSeqFuを用いた作成方法を解説します。
1.Qiime2を起動したまま,下記コマンドで01qiime2フォルダにディレクトリに移動します。
cd /Users/user/Desktop/MtInsects/01qiime2
2. SeqFuパッケージを用いて00Rawdataフォルダにマニュフェストファイルを作成します。
seqfu metadata --format manifest --threads 30 00Rawdata > ./00Rawdata/Manifest.tsv
00RawdataファイルにManifest.tsvファイルが生成していれば完了です。
マニュフェストファイルを用いたQiime2への配列データのインポート
作成したマニュフェストファイルを使って配列データをQiime2をインポートします。
作業ディレクトリは01qiime2(/Users/user/Desktop/MtInsects/01qiime2)のままで大丈夫です。
下記コマンドでインポートします。
qiime tools import --type 'SampleData[PairedEndSequencesWithQuality]' --input-path ./00Rawdata/Manifest.tsv --input-format PairedEndFastqManifestPhred33V2 --output-path ./01output/qza/00demux.qza
注意点:seqfuで作成したManifestファイル使用する場合,–input-format PairedEndFastqManifestPhred33の語尾にV2を付けることを忘れないようにしましょう。
下記のようにインポートが完了し,qzaフォルダに00demux.qzaファイルが作成されていればOKです。
Terminal画面
Imported ./00Rawdata/Manifest.tsv as PairedEndFastqManifestPhred33V2 to ./01output/qza/00demux.qza
最後に
マニュフェストファイルの作成と配列データのインポート方法を解説しました。
次回はCutadaptやDADA2を用いて配列データの前処理方法を解説します。