研究室紹介

情報生命科学群/基幹講座フリス研究室
(大規模バイオ情報解析分野)

私たちの研究室では、遺伝子配列から興味深い情報を見つけ出すこと、また、見つけ出すためのアルゴリズムや数学的手法の開発を行っています。

例えば、研究を通して、胚発生時の遺伝子発現を制御するDNA断片を発見しました。この発見により、ヒトとサンゴの共通祖先からずっと保存されてきた動物の発育制御システムが明らかになりました。 別の研究プロジェクトでは、確率に基づく高感度の分析によって、史上最古の化石タンパク質(かつてタンパク質をコードしていたDNA断片)を発見しました。これにより、古生代の脊椎動物の祖先における転移因子の多様性が明らかになりました。 また、史上最古の化石ウイルス(宿主ゲノムに挿入されたウイルスのDNA断片)も発見しました。 更に別のプロジェクトでは、ゲノムとプロテオームにおいて、統計学的に有意に存在しない配列を発見し、免疫認識と病原体/宿主の適応に関する手がかりを得ました。 大きな配列データを高速に解析するために、配列中の位置の部分集合をサンプリングする数学的に最適な方法も開発しました。 このほかに、私たちの研究室では、医療遺伝学者との共同研究も行っています。 複雑な染色体の再構成、タンデムリピートの拡大/縮小、ウイルスDNAの挿入など、病気の原因となる事象について理解することを目的としており、 実際に研究を通して、ヒトにのみ存在する遺伝子におけるタンデムリピートの拡大が、神経変性疾患の一つである神経核内封入体病の原因であることを突き止めました。

研究キーワード
ゲノム、相同、進化、確率、繰り返し配列
  • Animals in which each regulatory DNA element was detected. Regulatory segments are colored according to the gene they regulate: homeobox genes red, other transcription factors blue. Each animal’s phylum is written on the left, deuterostomes in purple and protostomes in green.

参考文献・論文
  • DNA conserved in diverse animals since the Precambrian controls genes for embryonic development. Frith MC, Ni S. Mol Biol Evol. 2023 msad275.
  • Improved DNA-Versus-Protein Homology Search for Protein Fossils. Yao Y, Frith MC. IEEE/ACM Trans Comput Biol Bioinform. 2023 20(3):1691-1699.
  • How to optimally sample a sequence for rapid analysis. Frith MC, Shaw J, Spouge JL. Bioinformatics. 2023 39(2):btad057.
  • An immune-suppressing protein in human endogenous retroviruses. Zhang H, Ni S, Frith MC. Bioinform Adv. 2023 3(1):vbad013.
  • Finding Rearrangements in Nanopore DNA Reads with LAST and dnarrange. Frith MC, Mitsuhashi S. Methods Mol Biol. 2023 2632:161-175.
  • Paleozoic Protein Fossils Illuminate the Evolution of Vertebrate Genomes and Transposable Elements. Frith MC. Mol Biol Evol. 2022 39(4):msac068.
  • Significant non-existence of sequences in genomes and proteomes. Koulouras G, Frith MC. Nucleic Acids Res. 2021 49(6):3139-3155.
  • Minimally overlapping words for sequence similarity search. Frith MC, Noe L, Kucherov G. Bioinformatics. 2021 36(22-23):5344-5350.
  • A pipeline for complete characterization of complex germline rearrangements from long DNA reads. Mitsuhashi S, Ohori S, Katoh K, Frith MC, Matsumoto N. Genome Med. 2020 12(1):67.
  • How sequence alignment scores correspond to probability models. Frith MC. Bioinformatics. 2020 36(2):408-415.
  • Long-read sequencing identifies GGC repeat expansions in NOTCH2NLC associated with neuronal intranuclear inclusion disease. Sone J, Mitsuhashi S, Fujita A, Mizuguchi T, Hamanaka K, Mori K, Koike H, Hashiguchi A, Takashima H, Sugiyama H, Kohno Y, Takiyama Y, Maeda K, Doi H, Koyano S, Takeuchi H, Kawamoto M, Kohara N, Ando T, Ieda T, Kita Y, Kokubun N, Tsuboi Y, Katoh K, Kino Y, Katsuno M, Iwasaki Y, Yoshida M, Tanaka F, Suzuki IK, Frith MC, Matsumoto N, Sobue G. Nat Genet. 2019 51(8):1215-1221.
  • A survey of localized sequence rearrangements in human DNA. Frith MC, Khan S. Nucleic Acids Res. 2018 46(4):1661-1673.
  • Training alignment parameters for arbitrary sequencers with LAST-TRAIN. Hamada M, Ono Y, Asai K, Frith MC. Bioinformatics. 2017 33(6):926-928.
  • Split-alignment of genomes finds orthologies more accurately. Frith MC, Kawaguchi R. Genome Biol. 2015 16(1):106.
  • Adaptive seeds tame genomic sequence comparison. Kielbasa SM, Wan R, Sato K, Horton P, Frith MC. Genome Res. 2011 21(3):487-93.
  • A new repeat-masking method enables specific detection of homologous sequences. Frith MC. Nucleic Acids Res. 2011 39(4):e23.
トップへ