BIOLOGY COLLECTIONS

 

 

生物学に関連するデータは、次世代シーケンシング(NGS)、遺伝子発現、質量分析、配列データなど、形式が多岐にわたります。したがって、この種のデータを処理するツールには、データ・サイエンスと生物学の両方の分野に関する深い知識が必要です。

BIOVIA Pipeline Pilot Biology Collections は、研究者とプログラマーがソリューションを迅速に開発して生物学データを解析するための技術的な基盤となります。

科学的に関連性のある実用的なインサイトを構築しましょう。

次世代シーケンシング・コレクション

ライフサイエンスの研究機関は、大規模なゲノム配列データを、個別化医療、農業研究、バイオ燃料開発などの分野の研究に適用しています。Next Generation Sequencing (NGS) Collection には、優れた機能と柔軟性を備えたデータ解析用の包括的な NGS データ解析パイプラインが用意されています。

  • 幅広い NGS 解析を生成
    • De novo アセンブリー、参照(ゲノム配列)へのマッピング、SNP および構造多型の検出、RNA-Seq、CNV-Seq、ChIP-Seq、Methyl-Seq、大規模なゲノム比較
  • 業界標準アルゴリズムを統合
    • BWA-MEM、Bowtie 2、GATK、BreakDancer、TopHat、Cufflinks、SAMtools、Velvet
  • NGS データ・ファイルの使用方法を簡素化
    • 参照配列、アライメント、特徴のアノテーション
  • 解析、解釈、レポートの合理化
    • GBrowse、IGV、Tablet、Circos に加えて、インタラクティブなグラフ、表、チャート
配列解析

BIOVIA Pipeline Pilot Sequence Analysis には、実用的な配列解析ワークフローを作成するための基本的なバイオインフォマティクス機能とアルゴリズムが用意されています。180 以上の異なるコンポーネント機能により、さまざまな業界標準の方法を使用、あるいは独自の方法を構築し、DNA およびタンパク質配列の解析とアノテーションを実行します。

  • 配列アライメントを生成
    • ClustalW と隠れマルコフ・モデル(HMM)で複数の配列をアライメント
  • パターン・マッチングを簡素化
    • PROSITE 領域、GC リッチ領域、タンパク質分解的切断部位、制限酵素部位、シグナル・ペプチド切断部位、オープン・リーディング・フレーム、正規の発現パターンを特定
  • 類似検索を実行
    • BLAST、PSI-BLAST、MegaBLAST
  • 配列のアノテーションおよび操作
    • DNA: プライマー識別、GC 含量、6 フレーム翻訳、逆相補鎖、siRNA ターゲット部位予測
    • タンパク質: 逆翻訳、二次構造予測、等電点
  • サードパーティー製ツールとデータベースを統合
    • BioPerl、NCBI BLAST、GCG プログラム、EMBOSS ツール、BioJava、Entrez、EB-eye クエリーを実行
プロテオミクス向け遺伝子発現および質量分析

–Omics ベースの解析には、幅広い分野にまたがる大量のデータ型が必要です。Gene Expression and Mass Spectrometry Collections は、カスタマイズされた –omics ワークフローを作成して自動化するための包括的なツール群です。

  • アクセス性の向上
    • スクリプトや R パッケージが不要な BioConductor ツールを使用
  • サードパーティーのデータ・ソースにアクセス
    • GEO データ・セットのダウンロードと解析
  • ペプチドおよびマップ対象タンパク質の抽出
    • X!Tandem
  • 特徴ピークの抽出、特定、整列
    • XCMS
  • タグ付けされたサンプルの解析
    • タンパク質量の ASAPRatio 計算
  • さまざまな形式に対応
    • .RAW*、.wiff、SEQUEST DTA、ANDI (netCDF)、Mascot MGF、mzXML 形式のファイルによる読み込み
  • データの視覚化
    • インタラクティブ・クロマトグラム、2D 質量分析ラン・チャート、スキャン・チャート、特徴ピーク・チャート、滞留時間ドリフト・チャート、フラグメントグラム、ペプチドおよびタンパク質のドリルダウンビューア、ヒートマップ