Dados Espaciais

SpatialData unifica e integra dados de diferentes tecnologias ômicas espaciais. Crédito: Isabel Romero Calvo/EMBL

SpatialData é uma ferramenta de acesso gratuito para unificar e integrar dados de diferentes tecnologias ômicas que contabilizam informações espaciais, o que pode fornecer insights holísticos sobre saúde e doença.

Os processos biológicos são enquadrados pelo contexto em que ocorrem. Uma nova ferramenta desenvolvida pelo Grupo Stegle da EMBL Heidelberg e pelo Centro Alemão de Pesquisa do Câncer (DKFZ) ajuda a colocar os resultados da pesquisa em biologia molecular em um contexto melhor do ambiente celular, integrando diferentes formas de dados espaciais.

Num tecido, cada célula individual está rodeada por outras células e todas interagem constantemente entre si para dar origem à função biológica. Para compreender como os tecidos funcionam ou funcionam mal em doenças como o cancro, é crucial não só aprender as características de cada célula, mas também explicar o seu contexto espacial. A caracterização quantitativa das células no contexto do espaço físico que habitam é fundamental para a compreensão de sistemas complexos.

As tecnologias que permitem estes tipos de exploração são chamadas de tecnologias ómicas espaciais, e o seu desenvolvimento progressivo está a contribuir para o aumento da popularidade da biologia espacial. Tais tecnologias podem fornecer informações detalhadas sobre a composição molecular de células individuais e seu arranjo espacial. No entanto, essas tecnologias concentram-se em diferentes características de uma célula – como ARN ou níveis de proteína, e os conjuntos de dados resultantes são gerenciados e armazenados de diversas maneiras. Para resolver este desafio, um projeto colaborativo liderado pelo Grupo Stegle desenvolveu o SpatialData, um padrão de dados e estrutura de software que permite aos cientistas representar dados de uma ampla gama de tecnologias ômicas espaciais de maneira unificada.

Desenvolvimento de Tecnologia para Biologia Espacial

Durante a última década, inúmeras tecnologias foram desenvolvidas tanto pela academia quanto pela indústria para visualizar espacialmente tecidos, células e compartimentos subcelulares. No entanto, cada técnica concentra-se num pequeno número de características desejáveis ​​e apresenta compromissos relacionados. Por exemplo, o Visium da 10x Genomics captura informações sobre a expressão de todos os genes em um tecido, mas não fornece resolução unicelular. Em contraste, o ensaio 10x Genomics Xenium, MERFISH ou a plataforma MERSCOPE da Vizgen produzem mapas refinados de expressão gênica com resolução subcelular. No entanto, estes ensaios estão atualmente limitados a algumas centenas de genes pré-selecionados. E a lista dessas tecnologias, cada uma fornecendo uma pequena fatia do quadro completo, continua a crescer.

Desafios das tecnologias ômicas espaciais

Esta heterogeneidade de tecnologias reflete-se no lado computacional por uma heterogeneidade ainda maior de formatos de ficheiros: cada tecnologia vem com o seu próprio formato de armazenamento, e muitas vezes os dados gerados pela mesma tecnologia podem ser armazenados em múltiplos formatos.

Na prática, isso traz vários desafios para a análise de dados ômicos espaciais. Os métodos de visualização e análise geralmente são adaptados a uma tecnologia específica, o que limita a compatibilidade dos dados e dificulta a integração de diferentes métodos em um único pipeline de análise. No entanto, para uma compreensão holística de um sistema biológico, é importante observar simultaneamente diferentes características celulares ou amostras de diferentes locais. As tecnologias ômicas geram enormes quantidades de dados (terabytes de imagens, milhões de células, bilhões de moléculas únicas), exigindo soluções de engenharia otimizadas. Assim, a biologia espacial necessita urgentemente de um quadro universal que possa integrar dados através de experiências e tecnologias e fornecer conhecimentos holísticos sobre a saúde e a doença. É aqui que entra o SpatialData.

SpatialData – uma estrutura para unir todos eles

“Há uma forte necessidade de estabelecer soluções comunitárias para a gestão e armazenamento de dados ómicos espaciais. Em particular, há uma necessidade de desenvolver novos padrões de dados e bases computacionais que permitam unificar abordagens de análise em todo o espectro de diferentes tecnologias ômicas espaciais que estão surgindo”, disse Oliver Stegle, Líder do Grupo EMBL na Unidade de Biologia do Genoma, e chefe da divisão de Genômica Computacional e Genética de Sistemas do Centro Alemão de Pesquisa do Câncer (DKFZ). “Um primeiro grande passo nessa direção é o SpatialData, um padrão de dados e estrutura de software que conecta e adapta conceitos anteriores de gerenciamento de dados, desde multi-ômicas de célula única até o domínio espacial.”

SpatialData unifica e integra dados de diferentes tecnologias ômicas, unindo tecnologias de ponta a uma estrutura que permite acesso e manipulação de dados com desempenho computacional. Esta ferramenta foi introduzida recentemente Métodos da Natureza publicação, de autoria de Luca Marconato durante seu doutorado no EMBL no Grupo Stegle, uma graduação conjunta com a Faculdade de Biociências da Universidade de Heidelberg. “Desenvolvemos a estrutura SpatialData para aliviar os desafios de representação de dados ao estudar biologia espacial, para que o pesquisador possa se concentrar na análise biológica, em vez de ser retardado por manipulações tediosas de dados, que de outra forma seriam necessárias apenas para visualizar os dados. A estrutura fornece uma representação unificada e implementa operações ergonômicas para processamento conveniente de dados ômicos espaciais”, disse Marconato.

A ferramenta permite que qualquer pesquisador importe seus dados e execute tarefas como representação, processamento e visualização de dados. Além disso, oferece a opção de anotar os dados de forma interativa e salvá-los em um formato independente de linguagem, facilitando o surgimento de estratégias de análise que combinem métodos de diferentes linguagens de programação ou comunidades de análise.

A estrutura foi desenvolvida como um projeto colaborativo entre múltiplas instituições, como o DKFZ, a Universidade Técnica de Munique, o Centro Helmholtz de Munique, a German BioImaging, o ETH Zürich, o Centro VIB para Pesquisa de Inflamação na Bélgica, bem como o Huber e Saka. grupos no EMBL.

“Conduzimos a nossa investigação e desenvolvimento tecnológico tendo em mente o benefício para a comunidade científica em geral”, disse Giovanni Palla, co-autor e estudante de doutoramento no Helmholtz Center Munich. “Não apenas estabelecemos um projeto de colaboração interdisciplinar entre institutos de pesquisa, mas também trabalhamos em estreita colaboração com desenvolvedores que trabalham com diferentes tecnologias espaciais e em diferentes linguagens de programação para resolver o problema da interoperabilidade. Como resultado, nossa estrutura é compatível com a grande maioria dos ensaios ômicos espaciais da academia e da indústria. Sendo publicado abertamente, outros investigadores podem agora usar livremente o SpatialData para gerir os seus próprios dados e ter a oportunidade de colaborar em várias tecnologias e tópicos de investigação.”

“Em nosso artigo, ilustramos três características importantes do SpatialData”, explicou Kevin Yamauchi, co-autor e pesquisador de pós-doutorado na ETH Zürich. “Primeiro, apresentamos uma interface padronizada e um formato de armazenamento unificado (baseado no OME-NGFF) para todas as tecnologias ômicas espaciais. Segundo, usando a representação unificada, integramos sinais de múltiplas modalidades. Aqui, transferimos anotações entre modalidades e quantificamos sinais usando essas anotações transferidas. Finalmente, apresentamos uma maneira de anotar imagens (patologia) de forma interativa e usar as anotações para analisar os perfis moleculares associados.”

SpatialData fornece uma representação interativa de dados, tanto no disco rígido quanto na RAM do computador, o que permite a análise de grandes dados de imagem ou de múltiplas geometrias ou células. Outra característica importante é a capacidade da estrutura de alinhar e anotar dados ômicos em um sistema de coordenadas comum. Assim, SpatialData permite o gerenciamento e a manipulação eficientes de conjuntos de dados espaciais, incluindo a definição de um sistema de coordenadas comum entre tecnologias baseadas em sequenciamento e imagens.
Aplicação em Câncer de Mama

A equipe interdisciplinar usou a estrutura SpatialData para reanalisar um conjunto de dados multimodal de câncer de mama da 10X Genomics como prova de conceito. Esse conjunto de dados compreende seções consecutivas do mesmo bloco de câncer de mama, onde cada seção é analisada usando tecnologia diferente, como Visium, Xenium e um conjunto de dados scRNA-seq separado. O estudo demonstra a natureza complementar dessas tecnologias.

“Ao integrar 10X Xenium e scRNAseq, mapeamos os tipos de células no espaço”, disse Elyas Heidari, candidato a doutorado na DKFZ e um dos autores do estudo. “Em seguida, usamos o 10X Visium para identificar clones de câncer no espaço. Isso pode ser feito porque temos leituras de todo o transcriptoma. Finalmente, utilizamos as imagens de microscopia coradas com H&E para identificar regiões de interesse para anotações histopatológicas. Esta análise apresentou com sucesso uma aplicação única de SpatialData no desbloqueio de análises multimodais de conjuntos de dados resolvidos espacialmente.”

No futuro, o tumor de um paciente poderá ser analisado com diferentes tecnologias comumente usadas na clínica, com os dados então unificados pelo SpatialData para obter uma compreensão holística do tumor. Além disso, a interface interativa permitiria ao médico anotar os dados, permitindo assim uma análise detalhada de regiões e características específicas do tumor, levando potencialmente a abordagens de tratamento personalizadas.

Referência: “SpatialData: uma estrutura de dados aberta e universal para ômicas espaciais” por Luca Marconato, Giovanni Palla, Kevin A. Yamauchi, Isaac Virshup, Elyas Heidari, Tim Treis, Wouter-Michiel Vierdag, Marcella Toth, Sonja Stockhaus, Rahul B. Shrestha, Benjamin Rombaut, Lotte Pollaris, Laurens Lehner, Harald Vöhringer, Ilia Kats, Yvan Saeys, Sinem K. Saka, Wolfgang Huber, Moritz Gerstung, Josh Moore, Fabian J. Theis e Oliver Stegle, 20 de março de 2024, Métodos da Natureza.
DOI: 10.1038/s41592-024-02212-x



Share. Facebook Twitter Pinterest LinkedIn Tumblr Email

Formado em Educação Física, apaixonado por tecnologia, decidi criar o site news space em 2022 para divulgar meu trabalho, tenho como objetivo fornecer informações relevantes e descomplicadas sobre diversos assuntos, incluindo jogos, tecnologia, esportes, educação e muito mais.