O objectivo do estudo consistiu na utilização de um conjunto de técnicas computacionais para encontrar associações entre dados genéticos (informação alélica de microsatélites) e fenotípicos em estirpes autóctones de Saccharomyces cerevisiae. Uma colecção de 300 estirpes de S. cerevisiae foi obtida em ambientes vitivinícolas de Portugal durante os últimos anos. Recorrendo a redes neuronais foi constituído um subconjunto de 103 estirpes e caracterizado posteriormente quanto à sua combinação alélica de 11 microsatélites polimórficos específicos de S. cerevisiae. Os fenótipos foram avaliados através de critérios taxonómicos (testes de assimilação de carbono e azoto, crescimento a diferentes temperaturas) e testes com relevância biotecnológica (resistência ao etanol, formação de H2S ou precursores aromáticos). De um modo geral, os resultados fenotípicos expressos como densidade óptica (A640) após 22 horas de crescimento estão de acordo com dados taxonómicos, embora com algumas excepções uma vez que algumas estirpes foram capazes de consumir arabinose e ribose. Apesar da sua proveniência de regiões vitivinícolas próximas (50-100 km), foi obtido um perfil fenotípico único para cada estirpe, o que demonstra a sua elevada variabilidade. A partir da informação alélica dos microsatélites, foi treinado um classificador Bayesiano que conseguiu atribuir a maioria das estirpes à quinta a partir da qual foram isoladas (AUC=0.81, p<10-8). Identificamos também subgrupos de estirpes que partilham semelhanças entre padrões alélicos de microsatélites e perfis fenotípicos (AUC>0.75). Estes subgrupos foram encontrados para todas as estirpes com baixa resistência ao etanol (A640 <0.6), crescimento em diferentes meios (meio MS a 30°C, meio YNB com galactose e rafinose como fonte de carbono ou ureia como fonte de azoto). Este estudo demonstra que as referidas abordagens computacionais podem ser usadas para estabelecer relações genótipo-fenótipo e para prever o potencial biotecnológico de uma estirpe, como por exemplo a sua resistência ao etanol. Este trabalho foi financiado pelos programas POCI 2010 (FEDER /FCT, POCTI/AGR/56102/2004), PTDC (AGR-ALI/103392/2008) e o Sétimo Programa Quadro da Comunidade Europeia (7PQ / 2007-2013) sob o contrato n º 232454. 1 Centro de Biologia Molecular e Ambiental (CBMA) Universidade do Minho, Braga, Portugal 2 Faculty of Computer and Information Science, University of Ljubljana, Slovenia 3 Department of Molecular and Human Genetics, Baylor College of Medicine, Houston, Texas, USA *e-mail: ricardofilipeduarte@gmail.com

Ligações externas