PDF をダウンロード

1
Handbooks
BioSample Handbook
公開日: 2014年3月17日; 最終更新日: 2015年1月7日
BioSample
BioSample について
概要
サンプル
リファレンスバイオサンプル
サンプルの属性
生物名
Locus tag prefix としての使用
XML スキーマ
メタデータ
Submitter
General info
Sample type
Attributes
Publications
Comments
BioSample への登録
サンプルの登録
新規サンプルの登録
データ公開
データ更新
免責事項
BioSample
BioSample について
概要
BioSample はデータベースに登録されている実験データを得るのに使われたサンプルに関する情報を管理するデー
タベースです。
以下の図は BioSample がどのように他の DDBJ のデータベースとリンクしているかを示しています。 この例は,デー
タと二つの BioSample,三つの BioProject,一つの Umbrella BioProject から構成されています。 ユーザは
BioProject または BioSample データベースを検索し,目的のレコードを取得,そこからのリンクをたどることによって
DDBJ,DRA や DOR に登録されている関連する実験データを得ることができます。
BioSample Handbook Handbook
2
BioSample と他の DDBJ データベースとの連携
サンプル
DDBJ のデータベースに登録されているサンプルが多様であること,また,サンプルの適切な記載方法が研究内容に
より異なることから BioSample の定義は柔軟なものになっています。 BioSample の典型的な例としては,セルライ
ン,組織の生検,生物個体や環境サンプルなどが挙げられます。
BioSample はサンプルについての以下のような情報を含みます:
生物種
採取された生物試料,例: 器官,組織,セルタイプ
表現型 - 疾患や個人の医学的な情報など
ヒトに関する情報とそれへのアクセスは適用される全ての倫理的な要請を満たしている必要があります。 DDBJ
BioSample データベースはアクセスを制限する仕組みを持っていないため,プライバシーに抵触する可能性のあるヒト
由来サンプルを登録することはできません。
リファレンスバイオサンプル
BioSample に登録されたサンプルの一部は,多くの実験で共通に使用されるかもしれません。 ここではこのようなサ
ンプルセットのことを " リファレンスバイオサンプル (reference biosample)" と呼びます。 リファレンスバイオサンプル
の例としては,広く使われているセルラインやマウスの系統が挙げられます。
BioSample では広く使われているサンプルが事前に BioSample にカタログ化されており,すぐに引用できるように
なっています。 これは,登録者が新しい実験データを DDBJ/EBI/NCBI に登録する度に,汎用的なサンプルを毎回
BioSample に登録しなくても済むようにするためです。 現在,リファレンスバイオサンプルには ATCC と Coriell が含
まれています。
サンプルの属性
BioSample レコードを構成する主要部分は「サンプル属性」です。 属性にはセルタイプ,採取地や表現型などの情報
を記載することができ,対象となるサンプルを定義します。 BioSample の属性は構造化された「属性名:値」
(name:value) の組として表現されます。例) tissue:liver
BioSample は属性名にコントロールされた語句 ("辞書") を使うことをサポートしています。
DDBJ BioSample に実装された最初の辞書は Genomics Standards Consortium によって作成されたゲノム,メ
タゲノム,ターゲットローカスの記載を標準化するために最低限必要な情報を定めた MIxS チェックリストです。
MIxS チェックリストについては Nature Biotechnology 29, 415–420 (2011) | doi: 10.1038/nbt.1823
(PMID:21552244 ) を参照してください。
BioSample Handbook Handbook
3
MIxS チェックリスト
生物名
BioSample の organism に記載する生物名については「生物名について」をご覧ください。 以前は微生物などで完
全長ゲノム配列を登録する場合,種の学名に加えて strain などの名称を organism に含めて記載していましたが,現
在は学名のみの記載を原則としています。strain 名は BioSample の strain に記入します。
関連するお知らせ: 生物の株情報を管理する方法が変更になります
Locus tag prefix としての使用
タンパク質コード遺伝子等の feature が付加されたゲノム配列を DDBJ に登録する際には,ユニークな Locus tag
prefix が必要です。 登録した BioSample アクセッション番号 (プレフィックス SAMD) を Locus tag prefix として使用
することができます (2014年9月3日)。従来通り,希望するタグ名を使用することもできます。
XML スキーマ
BioSample の XML スキーマ。今後変更される可能性があります。
biosample.xsd
メタデータ
必須*
条件によって必須*
Submitter
Contact Pe rs on
登録者情報。登録に関する連絡はここに記載された E-mail アドレス宛てに行われます。 必要な人数分作成します。
連絡先情報は DDBJ スタッフが登録者に連絡するために使われ,一般に公開されることはありません。 連絡先情報の
かわりに研究者の所属する組織に関する情報が公開されます。
First name *
登録者の first name。
Last name *
登録者の last name。
E-mail*
E-mail アドレス。所属する組織ドメインのメールアドレスを指定してください。
O rg aniz ation
Organization
コンタクトパーソンが所属する組織。
Submitting organization*
組織のフルネーム。
Submitting organization URL
登録者が所属する組織の URL。
Data Re le as e
"Hold" か "Release" のどちらかを選びます。公開予定日を指定することはできません。データ公開の仕組みについて
はデータ公開をご覧ください。
BioSample Handbook Handbook
4
Release
登録したサンプルは査定された後,公開されます。
Hold
この BioSample ID を引用している DDBJ,DRA,DTA,DOR レコードが公開されると同時に公開されます。この BioSample
ID を引用している非公開の DDBJ レコードが公開されることはありません。
General info
External Links
サンプルに直接関連するリソースの URL とそれに付けるラベル (表示名)。
Link description
サンプルに関連するウェブサイトの表示名。
URL
ウェブサイトの URL。
Sample type
Core Packag e
Genome, metagenome or marker sequences (MIxS compliant)
ゲノム,メタゲノムやマーカー配列の場合に使用します。ゲノム,メタゲノムやマーカー配列が由来するサンプルの記載方法を標準
化するため Genome Standards Consortium (GSC) が策定した属性が使われます。MIxS が定めた必須属性があるかどう
かで MIxS を満たしているかどうかが検証されます。MIxS についての詳細は GSC ウェブサイト をご覧ください。
Other samples (e.g. transcriptome, epigenetics etc)
transcriptome, epig enetics など,どのようなサンプルタイプにも使用することができます。一般的な属性と登録者が作成する
カスタム属性で記述されます。
MIxS
(Meta)Genomic Sequences Sample (MIMS)
Enviro nmental/Metageno me Geno mic Sequences
環境サンプルの説明もご参照ください。
Genomic Sequences Sample (MIGS)
Cultured Bacterial/Archaeal Geno mic Sequences
Eukaryo tic Geno mic Sequences
Viral Geno mic Sequences
特定宿主から確実に回収できる内部共生生物、多くの cyanobacteria のように容易に同定可能であるが培養ができない生
物、純粋培養は不可能でも罹患植物から確実に回収できる phytoplasmas といった対象は環境サンプルとは扱いません。
"Cultured Bacterial/Archaeal", "Eukaryotic", "Viral" のいずれかを選択します
Marker Sequences Sample (MIMARKS)
Specimen Marker Sequences
Survey related Marker Sequences
MIMARKS specimen: for marker g ene (e.g ., COI) sequences obtained from any material identifiable by means of
specimens
MIMARKS survey: for uncultured diversity marker g ene (e.g ., 16S rRNA, 18S rRNA, nif, amoA, rpo) surveys
BioSample Handbook Handbook
5
Environme ntal packag e
Environmental package (MIxS Sample)
以下のパッケージから適切なものを選びます。パッケージ毎に必要とされる属性が追加されます。
"Environmental/Metag enome Genomic Sequences" と "Survey related Marker Sequences" のときは No packag e
を選択できません。
No package
air
ho st-asso ciated
human-asso ciated
human-gut
human-o ral
human-skin
human-vaginal
micro bial mat/bio film
miscellaneo us o r artificial
plant-asso ciated
sediment
so il
wastewater/sludge
water
Attributes
Sample attributes
属性のリスト モデルごとにカスタマイズされた BioSample ワークシートをダウンロードします。 ワークシートはタブ区切りテキス
トファイルでスプレッドシートプログラムやテキストエディタで開くことができます。
Attributes
サンプル属性のリスト。必須項目に加えて,いくつかの推奨項目があります。BioSample データをより役立つものにするため,手
に入る全ての情報を登録してください。登録システムが,一般的に使われている属性を標準化された名称とともに提供します。登
録を準備する際は,属性のリストを参照し,該当する項目を入力してください。リストにない情報を持っている場合は Custom
Attribute を作成することができます。
Publications
PubMed ID
サンプルに直接関係する文献の PubMed ID を入力してください。文献情報は PubMed レコードから自動的に取得されます。
DO I
DOI
PubMed ID がない場合は DOI を入力してください。文献に関する以下の詳細情報を提供してください。
Reference title *
Journal title *
Year*
Volume *
BioSample Handbook Handbook
6
Issue *
Pages from*
Pages to*
First name *
MI
ミドルイニシャル。
Last name *
Suffix
This publication has multiple authors
チェックすると入力した著者名に "et al" が付け足されます。
Comments
Private comments to DDBJ staff
DDBJ スタッフへのコメント。コメントは内部的に使用されるだけで,公開されるレコードには含まれません。
BioSample への登録
ヒ トを対象とした研究データ の 登録について
ヒトを対象とした全ての研究において DDBJ に送付するデータの由来である個人 (被験者) の情報・プライバシー
は,適用されるべき法律,規定,登録者が所属している機関の方針に従い,登録者の責任において保護されている
必要があります。
原則として,被験者を直接特定し得る参照情報は,登録データから取り除いてください。
ヒトを対象とした研究データを登録する場合は「ヒトを対象とした研究データの登録について」をご覧ください。
サンプルの登録
新規サンプルの登録
D-way ウェブサイトの上部にある "BioSample" メニューから BioSample 登録ページに移動します。 BioSample
ページ内の [Submit new Sample] をクリックし,新規サンプル登録を作成します。
新規サンプルの作成
続いて表示されるウェブ画面でサンプルを作成,登録します。
Sample Type でサンプルの type を選択します。ゲノム,メタゲノム,マーカー配列を登録する場合は MIxS を選
択し,Environmental package から適切なものを選びます。
BioSample Handbook Handbook
7
サンプル内容の入力
SAMPLE TYPE タブで Sample type を選択し,ATTRIBUTES タブに進み,Sample type に応じたサンプル属性記入
用テキストファイルをダウンロードします。 一行目はヘッダーでサンプル属性名が入力されています。* が付いている項
目は必須です。 二行目以降に一行一サンプルで入力していきます。
サンプル属性ファイルの 記入例
*sample name *organism
*taxonomy id sample title
NBRC 101098 Alcanivorax sp. NBRC 101098 1113728
……
Alcanivorax sp. NBRC 101098 ……
サンプル属性ファイルの 実際の 例
BioSample accession Sample type Sample attributes
SAMD00018424
MIGS.ba
text
サンプル属性のタブ区切りテキストファイルでは1行に1サンプルの属性を入力します。行を複数作成することで,
複数の sample をまとめて登録することができます。
ウェブから投稿されたデータに対して SSUB で始まる仮 ID が自動的に割り当てられます。正式なアクセッション番号
が発行されるまでは,この仮 ID で登録を参照します。 DDBJ BioSample スタッフはデータを査定した後,完成した
データに対してプレフィックス "SAMD" のアクセッション番号を発行します。 D-way アカウントにログイン後,ウェブ上で
登録したサンプルの進行状況やアクセッション番号を確認することができます。
SSUB で始まる仮 ID を論文中に引用しないでください。
EBI/NCBI に登録したサンプルを DDBJ に重複して登録しないでください。
データ公開
以下の選択肢があります:
査定が終わった後すぐに公開
BioSample ID を引用しているデータと同時に公開
登録した Sample データは一定期間非公開にすることができます。 DDBJ レコードが公開されると,引用されている
BioSample データは自動的に公開されます。この BioSample ID を引用している非公開の DDBJ レコードが公開さ
れることはありません。
FAQ: BioProject/BioSample/塩基配列データの連動公開の仕組みは?
BioSample Handbook Handbook
8
データ更新
登録が完了したデータを更新することができます。ただし,Sample name は変更できません。メッセージフォームよりご
連絡ください。
免責事項
ソフトウェアの入手と利用は利用者の責任において行って下さい。 ソフトウェアの利用や誤った使用によって発生した損
失や損害に対して DDBJ は一切の責任を負いません。
BioSample Handbook Handbook