You are on page 1of 10

PUBLICADO: 8 DE ENERO DE 2015 | NÚMERO DE ARTÍCULO: 14005 | DOI: 10.1038 / NPLANTS.2014.

La duplicación de genes y el intercambio genético


impulsan la evolución de la autoincompatibilidad
basada en S-RNasa en Petunia.
Ken-ichi Kubo1, Timothy Paape2, Masaomi Hatakeyama2,3, Tetsuyuki Entani1, Akie
Takara1,Kie Kajihara1, Mai Tsukahara1, Rie Shimizu-Inatsugi2, Kentaro K. Shimizu2*
and Seiji Takayama1*

Los sistemas de autoincompatibilidad (SI) en las plantas floríferas distinguen los polen por sí mismos y los
que no lo son para evitar la endogamia. Mientras que otros sistemas SI confían en el autoreconocimiento
entre determinantes masculinos y femeninos específicos, la familia de las solanáceas tiene un sistema de
auto reconocimiento que da como resultado la detoxificación de los determinantes femeninos de las
ribonucleasas S (RNasas S) expresadas en pistilos , por múltiples determinantes masculinos de las
proteínas S-locus F-box (SLFs), expresadas en polen. No se sabe cuántos componentes de SLF de este
sistema de auto reconocimiento no existen en las especies de Solanaceae, o cómo evolucionaron.
Identificamos 16-20 SLFs en cada S-haplotipo en SI Petunia, de un total de 168 secuencias SLF utilizando
secuenciación de próxima generación a gran escala y técnicas de reacción en cadena de la polimerasa
genómica (PCR). Predijimos el objetivo S-RNasas de SLFs suponiendo que un particular S-alelo no debe
tener un SLF conservado que reconoce su propia S-RNasa, y validado estas predicciones por experimentos
de transformación. Un modelo matemático simple confirmó que 16-20 secuencias de SLF serían adecuadas
para reconocer la gran mayoría de las S-RNasas diana. Encontramos evidencia de eventos de conversión
de genes, que sugerimos son esenciales para la constitución de un sistema de auto reconocimiento y
también contribuyen a mutaciones autocompatibles.

La autoincompatibilidad es una barrera reproductiva genéticamente controlada en las angiospermas que permite que el
pistilo rechace el polen (genéticamente relacionado) y acepte el polen no uno mismo (genéticamente no relacionado) 1-
4. En la mayoría de los casos, esta autodiscriminación / no autodiscriminación se controla mediante determinantes de
especificidad masculina y femenina (polen-S, pistilo-S) codificados por genes multi-alélicos en el locus-S. Debido a
que el polen-S y el pistilo-S están estrechamente ligados entre sí en el locus S,las combinaciones de estos alelos se
consideran S-haplotipos.
Existen dos tipos principales de sistema SI: auto reconocimiento y no auto reconocimiento3. Aunque las especies SI en
Brassicaceae y en Papaveraceae difieren en sus proteínas determinantes, ambas poseen auto reconocimiento que depende
de las interacciones entre moléculas altamente polimórficas, un ligando y un tipo de receptor, derivado de un único S-
haplotipo1,2. En dicho sistema, la supresión de la recombinación entre el polen-S y el pistilo-S da como resultado formas
correspondientes de árboles filogenéticos de alelos (a menudo llamadas relaciones co-evolutivas en un sentido estricto)
5.
La autoincompatibilidad en Solanaceae, Plantaginaceae y Maloideae de Rosaceae no son sistemas de
autorreconocimiento3. En estas familias, el pistilo-S es una ribonucleasa secretada llamada S-RNasa, que ejerce efectos
citotóxicos que inhiben el alargamiento de los tubos de polen propios al degradar el ARN1-4; en consecuencia, el sistema
SI en estas familias se conoce como SI basado en RNasa. El polen-S es un conjunto de proteína (s) F-box, denominado
S-locus F-box (SLF (refs 1-4), también llamado S-haplotipo-F-box específico, SFB (ref. 6), o hermanos F-box
específicos de haplotipo S, SFBB (ref. 7) en Rosaceae), y funcionan como un componente de la ubiquitina ligasa tipo E
de SCF (Skp1-Cullin1-F-box) que generalmente media la ubiquitinación de proteínas diana para la degradación por el
26S proteasoma8. Previamente, propusimos que el SI basado en S-RNase en Solanaceae es un sistema colaborativo de
no autorreconocimiento, en el que el producto de cada SLF interactúa con un subconjunto de S-RNasas no propias y los
productos de múltiples tipos de SLF son necesarios para todo el conjunto de S-RNasas no propias que se reconocen
colectivamente y se detoxifican9.
En contraste con las relaciones co-evolutivas observadas en los determinantes de especificidad en Brassicaceae y
Papaveraceae, S-RNasas y SLFs derivadas de Solanaceae y Maloideae no presentaron filogenias de alelos
correspondientes. Una posible explicación para esta observación es que las S-RNasas y los SLF cada uno proliferan por
diferentes mecanismos, dándoles la apariencia de diferentes historias evolutivas a pesar del estrecho vínculo y la co-
herencia como un solo haplotipo. Aumentar el repertorio de genes SLF que constituyen el polen-S sería ventajoso, ya
que esto aumentaría el número de compañeros de apareamiento potenciales al permitir que el polen reconozca y
destoxifique más RNasas S no propias, mientras que un aumento en la diversidad de S-RNasas los genes de la S-RNasa
tendrían el efecto opuesto al permitir que las nuevas RNasas S escapen de la detoxificación por el repertorio existente
de proteínas SLF9. Este patrón se asemeja más al reconocimiento de la enfermedad y los modelos de evasión de
patógenos que otros sistemas de SI10. Tales factores pueden haber causado las diferencias en la diversificación evolutiva
de estos genes, pero los detalles subyacentes siguen sin estar claros. Con el fin de caracterizar la historia evolutiva de
todo el locus de no auto reconocimiento, llevamos a cabo una identificación a gran escala de los SLF de muchos S-
haplotipos.

Resultados
Petunia polen-S consiste en aproximadamente 18 tipos de SLF. Identificamos genes SLF de ocho haplotipos SI (S5,
S7, S9, S10, S11, S17, S19 y S22) y dos haplotipos autocompatibles (SC) (Sm y S0m, ver Métodos Suplementarios)
usando una combinación de la siguiente generación secuenciación (NGS) y técnicas de PCR. Inicialmente, construimos
bibliotecas de etiquetas de secuencias expresadas (EST) de órganos reproductores masculinos de líneas homocigotas
para cada S-haplotipo excepto S10, S22 y Sm, y luego identificó las secuencias relacionadas con SLF de estas bibliotecas
EST. A continuación, llevamos a cabo la PCR con transcripción inversa (RT-PCR) y la amplificación rápida de los
extremos del ADNc (RACE) -PCR para rellenar las lagunas y obtener secuencias de longitud completa. Luego clonamos
secuencias de codificación completas de nuevos SLF candidatos mediante PCR genómica para confirmar la ausencia de
errores de ensamblaje en todos los identificados (mediante la secuenciación de Sanger). Las reacciones de PCR se
aplicaron a todas las líneas, incluidas las homocigotas para los haplotipos S10-, S22 y Sm, para identificar SLF
adicionales y no detectados a través de NGS. La expresión de todos los SLF identificados en anteras se confirmó
mediante RT-PCR semicuantitativa. Finalmente, identificamos 16 (en el haplotipo S11) a 20 (en el haplotipo S19)
secuencias relacionadas con SLF por haplotipo, para un total de 168 secuencias (180 secuencias que incluyen 12
pseudogenes se enumeran en la Tabla 1 complementaria). En función de sus relaciones filogenéticas, los clasificamos
en 18 tipos (denominados SLF de tipo 1-18). Cuando las secuencias de más de tres S-haplotipos S se colapsaron en un
clado, los clasificamos como un tipo novedoso. Las secuencias desagrupadas que pertenecían a ninguno de estos 18
tipos se llamaron provisionalmente FBX (figura 1, figura 1 complementaria y tabla 1 complementaria).
Los análisis previos demostraron la vinculación genética entre los alelos ya conocidos de los SLF de tipo 1-6 y sus S-
RNasas afines9. Analizamos la vinculación de los SLF recién aislados utilizando pares de cebadores específicos de
genes (Tabla 2 complementaria). El examen de 48 plantas con S-haplotipos segregantes no reveló recombinación entre
los SLF y sus S-RNasas afines (Fig. 2 complementaria). También con fi rmó los perfiles de expresión específicos de
órganos reproductores masculinos de SLFs y FBXs recientemente aislados utilizando RT-PCR (Fig. 3 complementaria).
Estos resultados indicaron que hemos identificado candidatos fuertes para nuevos componentes de polen-S.

La diversidad y eliminación de SLF predicen S-RNasa objetivo. Las variaciones entre las secuencias alélicas dentro
de cada tipo de SLF se pueden clasificar en dos tipos de polimorfismos: la variación del número de copias y el
polimorfismo de la secuencia de aminoácidos. En cuanto a las variaciones del número de copias, se identificaron 0-2
genes de cada tipo de SLF en cada haplotipo S: por ejemplo, no se identificó SLF de tipo 9 en el haplotipo S19, mientras
que se detectaron dos copias de SLF de tipo 1 en los haplotipos S7, S17 y S19 (figura 2). Con respecto al polimorfismo
de la secuencia de aminoácidos, observamos alelos con alta conservación de secuencia y con una conservación de
secuencia relativamente moderada. Por ejemplo, en el tipo 3, siete alelos tienen alta conservación de secuencia (99.4-
87.4% de las identidades de aminoácidos), mientras que dos alelos (S7-SLF3, S11-SLF3B) tienen una conservación de
secuencia moderada (76.5-72.0%) (Fig. 2 y Tabla Suplementaria 3).
Asumiendo el modelo colaborativo de no autorreconocimiento9, un haxotipo Sx funcional no debe codificar un SLF
que reconozca y detoxifique su propia Sx-RNasa. Esto se puede lograr teniendo un alelo divergente o eliminado del tipo
SLF cuyo producto reconoce la Sx-RNasa. Esta lógica predice que si el haplotipo Sx no codifica un alelo altamente
conservado de tipo-n SLF (SLFn), el SLFn conservado reconocería la Sx-RNasa "no propia".
En cuanto a los SLF de tipo 3, el haplotipo S7 tiene solo un alelo relativamente divergente (S7-SLF3) (figura 2a). El
haplotipo S11 también tiene dicho alelo relativamente divergente (S11-SLF3B), pero también ha conservado uno (S11-
SLF3). Por lo tanto, el modelo predice que S7-RNase es el objetivo del SLF3 conservado. De hecho, nuestros
experimentos transgénicos previos mostraron que S11-SLF3 se dirigió a S7-RNase9. En nuestro estudio actual,
verificamos las interacciones mediante un enfoque transgénico similar que muestra que otro SLF3 conservado, S5-
SLF3, reconoce la S7-RNasa (para detalles de experimentos transgénicos para analizar la interacción S-RNasa-SLF in
vivo, véase la Fig. 3, Fig. 5 complementaria, y tablas suplementarias 4 y 5). Además, confirmamos que S7-SLF3 y S11-
SLF3B no reconocieron S7-RNasa (Figura 5 complementaria y Tabla 4 complementaria).
Como el caso de la eliminación, nos centramos en el clado SLF de tipo 9, donde S10- y S19-SLF9 estaban ausentes
(figura 2b). El modelo predice que S10- y S19-RNase podrían ser el objetivo de los SLF de tipo 9 conservados. Probamos
la S19-RNasa y descubrimos que, de hecho, estaba dirigida por dos productos alélicos de SLF de tipo 9 que habíamos
probado (S9-SFL9A y S11-SLF9, Fig. 6 complementaria y Tablas 4 y 5 complementarias). Además, encontramos que
los haplotipos S9, S5 y S10 carecen de SLF tipo 2, tipo 14 y tipo 6, respectivamente. Entre estos, la interacción
pronosticada entre los SLF de tipo 2 conservados y la S9-RNasa es consistente con nuestros resultados previos9.
Debemos enfatizar que el método predictivo no excluye la posibilidad de que los productos alélicos de SLF conservados
puedan actuar sobre S-RNasas diana adicionales. En el clado SLF de tipo 1, seis de ocho haplotipos S tenían un alelo
SLF altamente conservado, mientras que los haplotipos S17 y S22 solo tenían SLF1 relativamente divergentes (figura
2c). El modelo predice que tanto S17-RNasa como S22-RNasa son los objetivos de SLF1 conservado. Probamos
previamente cuatro alelos SLF1 conservados (S5, S7, S9, S11) y demostramos que todos ellos se dirigían a S17-RNase9.
Nuestro nuevo experimento confirmó que S22-RNase también es el objetivo de un SLF1 conservado, S7-SLF1 (Figura
7 complementaria y Tablas 4 y 5 complementarias). Además, nuestros experimentos previos mostraron que dos de los
SLF1 conservados (S5 y S7) se dirigieron a S9-RNasa, mientras que otros dos (S9 y S11) no lo hicieron, lo que implica
que un cambio evolutivo en la especificidad también podría ocurrir con sustituciones de aminoácidos muy limitadas .
Tal cambio es consistente con el mantenimiento de la función SI normal en el haplotipo S9.
Colectivamente, encontramos el siguiente patrón: Sx-RNase es un objetivo de SLFn si el alelo Sx de SLFn es divergente
o eliminado. Este enfoque predictivo es muy útil para identificar las S-RNasa (s) objetivo de cada tipo de SLF. De hecho,
entre ocho haplotipos SI S analizados en este estudio, pudimos predecir los tipos de SLF responsables para siete S-
RNasas, y cinco (S7, S9, S17, S19 y RNasas S22) entre ellos realmente se muestran interactuando con el predicen SLF
con evidencia experimental. Debido a que hay más de 40 haplotipos S en Petunia4, no es sorprendente que se haya
encontrado un SLF conservado en los ocho haplotipos S encuestados en la mayoría de los tipos de SLF (tipos 4, 5, 10,
11, 13 y 16, Fig. 1 complementaria), y es probable que se dirijan a S-RNasas de otros S-haplotipos no supervisados. En
las comparaciones de las secuencias SLF pertenecientes a los mismos tipos, la mayoría de las secuencias alélicas se
mostraron altamente conservadas, con identidades superiores al 90% (Tabla 3 complementaria). Los resultados del
ensayo in vivo descrito anteriormente sugirieron que la mayoría de estos SLF altamente conservados funcionan como
polen-S. Esto está en marcado contraste con otros sistemas SI de autorreconocimiento, como Brassica y Papaver, donde
la autodiscriminación / no autodependencia depende de las interacciones específicas del haploide S entre el polen-S
altamente divergente y el pistilo-S1,2.

Solanum S-loci contiene parálogos orthologous SLF-como. No es obvio cómo SLFs y S-RNases llegaron a constituir
una unidad genética en un solo locus S durante la evolución del sistema SI basado en RNasa, teniendo en cuenta la
diversidad mucho menor entre los SLF en relación con S-RNasas11. Llevamos a cabo análisis filogenéticos de SLF y
S-RNasas, incluidos los de otros géneros de solanáceas, explorando en primer lugar los ortólogos de SLF en las bases
de datos de genoma completo de tomate (Solanum lycopersicum) y patata (Solanum tuberosum) 12,13. Identificamos
37 y 66 secuencias F-box similares a SLF en estas dos especies (Métodos Suplementarios y Tabla Suplementaria 6).
Estos candidatos incluyen tanto SLF como otras secuencias similares a SLF. Los árboles filogenéticos que incluyen
secuencias que identificamos y publicamos secuencias relacionadas con el polen S en otras especies de S basadas en
RNasa (Fig. 4a, Suplementaria Fig. 8 y Tabla Suplementaria 7) muestran que las Petunia SLF se agrupan en un solo
grupo monofilético junto con 13 genes de tomate y 14 de patata (este subclade se conoce como el clado SLF de
Solanaceae, Fig. 4a y Fig. 8 complementaria). Todos los genes de tomate y patata pertenecientes al clado SLF de
Solanaceae se encuentran específicamente dentro de las regiones subcentroméricas ricas en repetición en el cromosoma
1 del S. lycopersicum ensamblado y el genoma de S. tuberosum, consistentes con las ubicaciones genéticamente
mapeadas de los loci S en estas especies (Fig. 4c) 14,15. Estos SLF Solanaceae se distribuyen en 17.9 Mb en tomate y
14.6 Mb en papa, lo que sugiere que los loci S de las solanáceas son muy grandes, de dos a tres órdenes de magnitud
más grandes que el locus S de Brassicaceae (28-110 kb) 16.
Los SLF alélicos son mucho más jóvenes que los alelos de S-RNasa y los tipos de SLF. Los tipos de SLF en Petunia
y otros SLF derivados de diferentes géneros en Solanaceae están distribuidos en todo el clado SLF de Solanaceae (Fig.
4a y Fig. 8c Suplementaria), lo que sugiere que la diversificación mayor de los tipos precedió a la separación de géneros
en Solanaceae. Esto es consistente con el extenso polimorfismo transespecífico encontrado en Solanaceae S-
RNasas17,18 (Fig. 4b, Suplementario Fig. 9 y Cuadro Suplementario 8). Sin embargo, hay subclusters pequeños
derivados específicamente de ciertos géneros, por ejemplo, los clústeres type-3 / -13, type-4 / -12 y type-9 / -10, lo que
sugiere que la generación de nuevos tipos de SLF podría haber continuado después de la separación de géneros. La
profundidad de ramificación de S-RNasas y SLF sugiere que el momento de la proliferación de los tipos de SLF en
lugar de los alelos de SLF individuales (figuras 1a y 3b y la figura adicional 8b) es similar al de los alelos de la S-RNasa
(figuras 1b y 3b y suplementario Fig. 9b). Los SLF alélicos pertenecientes a cada tipo se diversifican solo en las ramas
terminales del árbol y no hay pares de secuencias SLF estrechamente relacionadas entre los diferentes géneros de
solanáceas, lo que indica la diversificación de los SLF alélicos dentro de cada tipo seguido de la divergencia de géneros.
Estos resultados indican que cada género tiene una cantidad similar de tipos de SLF, pero no existe correspondencia uno
a uno de los tipos de SLF entre estos géneros, posiblemente debido a la rotación evolutiva de los tipos de SLF.
Las estimaciones de las tasas de sustitución sinónimas y sinónimas (Ks y Ka, respectivamente) entre SLF y S-RNasas
mostraron que los valores interalélicos de Ka y Ks de cada tipo de SLF (Ka = 0.000-0.090; Ks = 0.001-0.303) eran
mucho menores que los valores para las S-RNasas (Ka = 0.400; Ks = 0.850) en Petunia (Tabla Suplementaria 9). Sin
embargo, los valores intrahaplotípicos de Ka y Ks de SLF exhibieron rangos similares a los de las RNasas-S (Ka =
0.321-0.349; Ks = 0.747-0.762). Estos valores fueron similares en Solanum. Estos resultados indican que los alelos de
cada tipo de SLF son mucho más jóvenes que los alelos S-ARNasas y que los tipos SLF.

Los intercambios genéticos de SLF han ocurrido repetidamente. Nuestros hallazgos parecen estar en conflicto con la
recombinación completamente suprimida entre SLF y S-RNasas que se considera necesaria para mantener todos los
sistemas SI. Aunque está claro que el enlace en el locus S es generalmente necesario para mantener haplotipos
individuales en grandes regiones genómicas (por ejemplo, 15 Mb), sospechamos que el intercambio de SLF entre
haplotipos S a través del intercambio genético se ha producido repetidamente, al menos hasta hace relativamente poco
tiempo . Apoyando esta especulación, algunos conjuntos de genes comparten identidad completa entre varios alelos;
p.ej. los alelos S7 y S19 de los SLF de tipo 1 comparten secuencias de nucleótidos idénticas, mientras que los alelos de
las correspondientes RNasas S son bastante diferentes (47,5% de identidad de aminoácidos; Tabla 3 complementaria)
9. Estos hallazgos apoyan el intercambio genético entre los SLF, y el nivel extremadamente bajo de polimorfismo entre
los alelos SLF no puede explicarse únicamente purificando la selección en el reemplazo de aminoácidos, ya que tanto
Ks como Ka son bajos.
Para detectar una señal estadística de intercambio genético entre los SLF, utilizamos LDhat19 y GENECONV20. El
intercambio genético se estimó en alineaciones que contenían SLF de haplotipos mutantes autocompatibles (SC) y
nuevamente en alineamientos con estas secuencias eliminadas. Ambos enfoques detectaron el intercambio genético
entre alelos en SLF de tipo 3, -9 y -10 (Tablas complementarias 10 y 11). Cuando se incluyeron los SLF de haplotipos
SC, encontramos muchos más casos de intercambios significativos entre pares de alelos SLF, más fuertemente dentro
de SLF de tipo 9, así como entre SLF de tipo 9 y 9, que son grupos hermanos estrechamente relacionados (Tablas
complementarias 11). Varios tipos de SLF y pares de SLF dentro de los tipos exhiben in fl uencias signi fi cativas del
intercambio genético. En total, encontramos intercambio significativo entre 36 pares de SLF. Esta es una estimación
conservadora del intercambio genético en el locus S porque el enfoque descrito se centró en los puntos de ruptura de la
recombinación dentro de la secuencia codificante de un tipo SLF particular pero no puede detectar aquellos en las
regiones intergénicas que darían lugar al intercambio de SLF completos. En general, estos resultados indican que el
intercambio genético podría desempeñar un papel en la conservación de la función de SLF.

La conversión génica contribuyó a la evolución de los haplotipos SC. En el análisis anterior, detectamos la conversión
génica en los haplotipos S0m y Sm autocompatibles más predominantemente que los haplotipos autoincompatibles
(Tabla Suplementaria 11). Para investigar la relación entre la descomposición de SI y la recombinación entre los genes
SLF, se compararon los SLF entre el haplotipo SC del lado del polen y su haplotipo SI ancestral.
El haplotipo SC2 es un mutante SC del lado del polen del haplotipo S17 derivado de una población natural mixta SC /
SI de Petunia axil laris21 (Fig. 10a suplementaria). Nuestros datos mostraron que el haploide SC2 comparte una S-
RNasa y SLF con el haplotipo S17, pero también contiene un SLF1 adicional (SC2-SLF1C) idéntico al S7- / S19-SLF1
de tipo 'conservado'. (Suplementario Fig. 11a, b), lo que sugiere que esta duplicación debería ser la razón del desglose
de SI. Además del haplotipo SC2, hemos identificado recientemente un mutante SC del lado del polen adicional del
haplotipo S22, designado haplotipo S22m (Fig. 10b suplementaria). El haplotipo S22m comparte una S-RNasa con
haplotipo S22, pero también contiene un SLF1 adicional (S22m-SLF1B) que es idéntico a S7- / S19- / SC2- SLF1
(Figuras complementarias 11a, b). Nuestros experimentos transgénicos previos9 y los recientemente realizados (Fig. 2
y Fig. 5 complementaria) indicaron que la presencia de este SLF1 adicional común fue suficiente para la descomposición
de SI en SC2 y S22m-polen. Esto sugiere que el intercambio genético fue responsable de la evolución de la
autocompatibilidad (ver Discusión). La existencia de un SLF1 compartido entre cuatro haplotipos diferentes representa
la evidencia del intercambio genético SLF interhaplotípico reciente.
Curiosamente, además de type-1 SLF, encontramos que estos cuatro S-haplotipos también comparten un común tipo 8
SLF (S7- / S19- / SC2 / S22m-SLF8) (Fig. 11c y 12). Esto nos permitió comparar las filogenias entre SLF de tipo 1 y
de tipo 8, y encontramos que estos tipos mostraban topologías similares (Fig. 13). Este resultado sugiere que la unidad
de enlace SLF1-SLF8 podría haberse transferido entre diferentes haplotipos S a lo largo del tiempo evolutivo. Llegamos
a la conclusión de que el intercambio genético entre S-haplotipos y algunas unidades de vinculación se ha producido en
repetidas ocasiones y contribuye a la evolución de ambos SC y SI S-haplotipos.

Los modelos matemáticos sugieren que 16-20 SLF serían adecuados para el no reconocimiento de uno mismo. El
número de tipos de SLF es mucho menor que el de los alelos de S-RNase pronosticados (40 o más) 4, por lo que las
interacciones uno a uno entre un tipo SLF y una variante alélica S-RNase no son posibles. Más bien, algunos tipos de
SLF deberían interactuar con múltiples variantes alélicas de S-RNase, mientras que algunas S-RNasas pueden ser
reconocidas por múltiples tipos de SLF. Para estimar si los genes 16-20 SLF que identificamos aquí serían adecuados
para el no reconocimiento de uno mismo, compilamos los datos empíricos de las interacciones SLF y S-RNasa9,22,23,
incluidos los datos presentados en este estudio (Tabla complementaria 12), y desarrolló modelos simples. Entre las 129
combinaciones probadas de SLF y S-RNasa, 24 mostraron interacciones positivas; por lo tanto, un SLF reconocería un
18.6% S-RNases en promedio. Si planteamos una suposición simple de que los repertorios de S-RNase objetivo para
cada SLF son independientes y hay n SLF, no se puede reconocer la proporción de (1 - 0.186) n S-RNases. Por lo tanto,
n SLF pueden reconocer 1 - (1 - 0.186) n proporción de variantes alélicas de S-RNasa. Con n = 16-20, la probabilidad
de reconocimiento se aproxima a la saturación (figura 5a), que sería suficiente para que funcione este sistema
autoincompatible. A continuación, relajamos la suposición para que cada SLF pueda reconocer una proporción diferente
de S-RNasas diana. Debido a que los datos experimentales ya están disponibles del 50% (9/18) de los tipos de SLF (ver
Métodos Suplementarios), usamos la simulación de Monte Carlo con el arranque para estos datos. De nuevo,
encontramos que las interacciones se saturan con 16-20 tipos de SLF (figura 5b). Los modelos sugieren que los ocho
tipos de SLF previamente identificados pueden no constituir un sistema eficiente de auto reconocimiento, pero que de
16 a 20 SLF en cada haplotipo serían adecuados para reconocer la gran mayoría de los objetivos de S-RNasa si no todos,
que se estima tener aproximadamente 40 variantes alélicas en Petunia4. Los resultados también respaldan la validez del
número de SLF identificados en Petunia. Observamos que la tasa de reconocimiento de estos modelos se puede
considerar como estimaciones mínimas, ya que los diferentes tipos de SLF tienden a reconocer diferentes RNasas S, ya
que los objetivos superpuestos pueden no ser favorecidos por la selección. El límite superior del número de tipos SLF
debe estar limitado por factores tales como la intensidad de la depresión endogámica y la proporción de polen autóctono
depositado en un estigma en la población natural, la tasa de natalidad y mortalidad de los tipos SLF y el tamaño efectivo
de la población24- 26. Estos modelos simples sugieren que hemos identificado la mayoría de los componentes genéticos
de este sistema de auto reconocimiento.

Discusión
Los genes co-evolucionados para los sistemas de auto-reconocimiento y no auto-reconocimiento son notoriamente
difíciles de estudiar porque típicamente involucran dinámicas interorganismos, tales como resistencia a enfermedades y
virulencia, ya sea involucran fenotipos cuantitativos (con efectos epistáticos o pleiotrópicos) o son letales para uno o
ambos organismos. El reconocimiento de patógenos vegetales se rige por cientos de genes R duplicados que detectan
numerosos patógenos10. Los fenotipos de enfermedades autoinmunes por autorreconocimiento pueden observarse como
incompatibilidad de Dobzhansky-Muller en híbridos, porque una proteína R de un padre a menudo reconoce la
autoproteína derivada de otro padre27,28. Los sistemas genéticos SI de Solanaceae brindan una oportunidad única para
estudiar y modelar la dinámica evolutiva de genes co-evolutivos que se asemejan en gran medida al reconocimiento de
enfermedades y mecanismos de detoxificación, donde las proteínas SLF duplicadas necesitan reconocer diversas RNasas
S no propias pero no la auto S-RNase.
Nuestra búsqueda exhaustiva de nuevos genes SLF indicó que 16-20 SLF estaban presentes en cada uno de los diez
haplotipos de Petunia. Aunque solo se han informado anteriormente ocho tipos de SLF9,22,23, el análisis filogenético
demostró que estos podrían clasificarse en 18 tipos principales de SLF con duplicación o eliminación alélica ocasional
en cada tipo. Nuestros modelos matemáticos (Fig. 5) sugieren que 16-20 SLF en cada haplotipo serían adecuados para
reconocer la gran mayoría de aproximadamente 40 objetivos de S-RNasa4.
Nuestras observaciones filogenéticas sugieren que los orígenes de los tipos de SLF son tan antiguos como el origen de
los alelos de S-RNasas, mientras que los alelos de cada tipo de SLF son mucho más jóvenes que las S-RNasas. Esto está
en claro contraste con los sistemas SI de autorreconocimiento, en los cuales el polen-S y el pistilo-S muestran una
coevolución distinta en las sustituciones de nucleótidos5. La generación de nuevos tipos de SLF a través del intercambio
genético entre haplotipos proporciona una explicación para el patrón filogenético de los SLF en el sistema colaborativo
de no autorreconocimiento. Tres posibles consecuencias se postulan en la figura 6a. En el primer escenario, un SLF
nuevo adquirido por intercambio genético podría reconocer más efectivamente una gama más amplia de S-RNasas 'no
propias'. En tal caso, la adquisición de SLF podría conferir una ventaja para el cruce cruzado, y se fijaría en la población
(evolución de S1a a S1-haplotipos en la Fig. 6a). Este SLF se propagaría rápidamente sobre múltiples S-haplotipos en
la población y formaría un nuevo tipo de SLF con ramas cortas en el árbol filogenético (S1-SLFn en la Fig. 6b). En el
segundo escenario, los SLF recién adquiridos podrían reconocer una "RNasa" propia "endógena" como un objetivo
específico, induciendo la descomposición de SI (evolución de los haplotipos S2a a S2m en la figura 6a). La mayoría de
estos haplotipos SC S deberían perderse por una desventaja a corto plazo (depresión endogámica) y mostrar una rama
corta en un árbol filogenético (S2m-SLFn en la Fig. 6b). Ocasionalmente, los alelos autocompatibles se encuentran en
las poblaciones naturales mezcladas SC / SI de Petunia29, y podrían ser fijados por fuerzas selectivas tales como la
limitación de apareamiento o la ventaja de transmisión automática y escapando al rechazo de todos los haplotipos S en
cruzamiento 24,26,30-33. . Aunque desde hace tiempo se ha formulado la hipótesis de que la recombinación y / o la
conversión génica entre diferentes alelos S podría inducir la autocompatibilidad, no se ha encontrado un ejemplo claro.
En poblaciones naturales y domesticadas de Brassicaceae que poseen un sistema de autoreconocimiento uno a uno, las
mutaciones de pérdida de función del polen-S, pistilo-S o modificadores, en lugar de recombinación, han demostrado
ser responsables de la autocompatibilidad34. -36. Aquí proporcionamos evidencia experimental de que la adquisición
de un SLF1 por conversión génica ha llevado a la evolución de dos haplotipos SC (SC2 y S22m). La autocompatibilidad
en el polen-S también es consistente con la teoría que sugiere que las mutaciones en los componentes masculinos tienen
más probabilidades de propagarse en las poblaciones naturales26,33.
En el tercer escenario, algunos haplotipos SC generados en el segundo escenario podrían restaurar el fenotipo SI
causando mutaciones en el SLF responsable o su S-RNasa objetivo (evolución de S3a a S3 o haplotipos S4 en la Fig.
6a). La acumulación de mutaciones en el SLF adquirido podría regenerar un haplotipo SI S. Tal como se usa en la
predicción de S-RNasas diana, un S-haplopo SIS particular no debe tener el SLF que reconozca su propia S-RNasa; por
lo tanto, el alelo SLF debería perderse o divergir, mostrando una ramificación relativamente larga en el árbol filogenético
(S3-SLFn en la Fig. 6b). Las mutaciones en la S-RNasa diana también podrían regenerar un nuevo haplotipo SI S. Dicha
mutación S-RNasa que escapa al reconocimiento por un SLF puede conducir a la esterilidad femenina. En el sistema
colaborativo de no auto reconocimiento, el reconocimiento redundante de S-RNasa por múltiples SLF podría reducir el
riesgo y podría apoyar la evolución de nuevos haploides S (S4-RNasa en la figura 6b).
En Solanaceae, el locus S está ubicado en una región subcentromérica, rica en repeticiones y baja densidad de genes, en
la que la recombinación está fuertemente suprimida37,38. Hasta hace poco, no estaba claro cómo evolucionaron los
SLF a pesar de estar ubicados en una región genómica inactiva. Sin embargo, recientemente se ha demostrado que la
recombinación cruzada reciente (es decir, la recombinación homóloga) se suprime completamente en los centros,
mientras que la recombinación no cruzada (es decir, la conversión génica) no es39; por lo tanto, el intercambio genético
entre los SLF también podría ser posible. Otros estudios han sugerido que la recombinación intragénica también ha
contribuido a la diversidad de S-RNasas40,41, aunque la frecuencia parece ser rara. Alternativamente, el intercambio
genético mediado por ARN (retrotransposición) 42 también puede haber contribuido, porque el locus S de Petunia es
rico en retrotransposones43 y ningún gen SLF identificado hasta el momento contiene intrones. Sin embargo, nuestro
hallazgo de la unidad de enlace SLF1-SLF8 en varios haplotipos S sugiere que el primer evento es más probable, en
base a la distribución de esta unidad de enlace.
Nuestra identificación exhaustiva de SLF proporcionará datos útiles para caracterizar la evolución molecular de la SI
basada en RNasa, un tema que se ha debatido durante muchos años. En contraste con el modelo colaborativo de no auto
reconocimiento, los modelos tradicionales de SI asumieron el autorreconocimiento por un único producto
genético26,44,45. Los hallazgos descritos aquí indican que el polen-S y el pistilo-S han sufrido diferentes y complejos
patrones de evolución molecular y aparentemente dependen del intercambio de SLF así como de la acumulación
secuencial de sustitución de bases. En el futuro, debería ser posible explicar la evolución molecular de la especificidad
S en poblaciones usando simulaciones basadas en el modelo molecular que aquí proponemos.
Métodos
Materiales vegetales .Utilizamos líneas de haplotipos S5-, S7-, S9-S10-, S11-, S22-, S0m-, Sm- y S22m de Petunia
hybrida y las líneas de haplotipos S17-, S19- y SC2 de P. axillaris. (para más detalles, ver Información Complementaria).

Base de datos EST para el órgano reproductivo masculino de Petunia. Para la preparación de bibliotecas de cDNA
y NGS, ver Información Complementaria.
Bases de datos EST utilizando GENETYX-MAC (ver.16.0.6).

Identificación de nuevos genes SLF. La búsqueda BLAST (NCBI BLAST ver.2.2.24) local contra las bases de datos
EST se llevó a cabo con GENETYX-MAC, usando Petunia type 1-6 SLFs9 como consultas. Se extrajeron aciertos con
valores de evaluación (E) de menos de 10-20 y se ensamblaron usando ATSQ (ver 5.1.3, GENETYX) con los siguientes
parámetros: porcentaje de coincidencia, 50%; número mínimo de coincidencia, 10; y capacidad del grupo, 5,000. Todas
las secuencias ensambladas fueron verificadas manualmente. Para aislar SLF adicionales de S-haplotipos que no se
habían analizado utilizando NGS y para confirmar las secuencias de codificación de longitud completa, se realizó RACE
y PCR genómica. Los cebadores se enumeran en la tabla complementaria 2 y las condiciones de reacción se han descrito
previamente9. En cuanto a SLFs recién aisladas, para confirmar la falta de errores de montaje, regiones codificantes
enteras fueron amplificados ed genómico mediante PCR y se clonaron en el vector pGEM-T Easy (Promega). Al menos
ocho clones independientes para cada fragmento de SLF se secuenciaron en ambas cadenas mediante el método de
Sanger usando un analizador genético ABI 3130xl (Applied Biosystems).

Identificación de genes relacionados con S en Solanum. Las búsquedas de BLAST para SLF y S-RNasas en patata y
tomate se llevaron a cabo en Spud DB12 y en Genomic Network 13 utilizando bases de datos 'PGSC DM1-3
pseudomolecules (v4.03)' y 'ITAG annotation Release 2.4 CDS predicho (SL2.50) ', respectivamente. Petunia SLFs y
S-RNase de S7-haplotype se utilizaron como consultas. Los éxitos con valores E <10-20 se extrajeron como candidatos.
El análisis preliminar en tomate identificó solo ocho secuencias similares a SLF, que incluyen cuatro pseudogenes con
codones de parada prematuros, mucho menos que los de papa y Petunia. Una posible línea fue S. lineos, S. tuberosum
Phureja DM12,46, que es de la línea SC, S. lycopersicum cv. Heinz 1706 (ref 13). Teniendo en cuenta la posibilidad de
que la mayoría de los SLF se hayan dividido en tomate, llevamos a cabo una secuencia del cromosoma 1, e identificamos
otros pseudogenes similares a SLF no unnotados, llamados Solic01_pseudo1-5.
Para evaluar la autenticidad de los genes F-box relacionados con SLF, evaluamos el patrón de productos deducidos
mediante el uso de la herramienta de investigación de arquitectura modular simple (SMART) 47. Secuencias que se
juzga que no tienen ni patrones F-box ni FBA fueron eliminados. Los genes relacionados con SLF y relacionados con
S-RNase se enumeran en la Tabla Suplementaria 6. Para nombres de genes de papa, 'PGSC0003DMG' se omite de cada
ID de gen de patata por simplicidad, y '-STCHX' se adjunta a la ubicación del gen en El cromosoma x de S. tuberosum
en este trabajo (ver Fig. 4).

Análisis filogenético Las secuencias de aminoácidos deducidas o las secuencias de ADN codificante de los genes F-
box y RNase se alinearon con el algoritmo ClustalW, usando MEGA5 (ver 2.2, ref 48). Pseudogenes, frameshifts o
paradas prematuras se eliminaron manualmente. Sobre la base de las alineaciones, los árboles filogenéticos se
construyeron mediante el método de unión de vecinos utilizando MEGA5.
Los alineamientos de codón por codón de las secuencias codificantes de cualquier tipo de SLF o S-ARNas se
construyeron usando MEGA5. Sobre la base de estas alineaciones, las tasas de sustitución sinónimas y sinónimas (Ks y
Ka) se calcularon usando DnaSP (ver 5.10.1, ref 49), y la recombinación y conversión génica se evaluaron mediante
LDhat (ver 2.1, ref. 19) y GENECONV (ver 1.81, ref 20).

Estimación de la proporción de RNasa S reconocida por los SLF. Afirmamos que la proporción de S-RNasas
reconocidas por n tipos de SLF, PS (n), supone que cada SLF reconoce la variante alélica S-RNase independientemente
de la misma probabilidad expresada por la ecuación (1):

P S(n)= 1 − (1 − PR)n (1)


donde PR es la tasa de reconocimiento general y es la cantidad de tipos de SLF. La tasa de reconocimiento global PR
se define mediante la ecuación (2):
P = NP
R NT

donde NP es el número de interacciones positivas entre las variantes alélicas de S-RNasa y SLF y NT es el número total
de interacciones probadas. Se excluyó la interacción positiva S22-RNasa y S7-SLF1, porque se predijo la interacción
positiva y se probó S22-RNasa experimentalmente con S7-SLF1 solamente; por lo tanto, esto podría sesgar la estimación
de la tasa de reconocimiento global. S-RNase y SLF variantes alélicas. Tenga en cuenta que NP = 24 y NT = 129 en
realidad se asignan en este estudio, por lo que PR es casi igual a 0,186 (Tabla complementaria 13a). El intervalo
confidencial CI se calcula de la siguiente manera:

donde pi ∈ 0, 1, 0 y 1 indican las interacciones negativas y positivas, respectivamente, en cada interacción variante
alélica S-RNasa y SLF; t = 1,97867 es el valor de la función de distribución acumulada inversa del alumno en el percentil
95 de ambos lados de la distribución t para los grados de libertad NT-1.
También realizamos una simulación para considerar la diferencia entre los tipos de SLF. Para más detalles, ver
Información Complementaria.

Códigos de acceso. Secuencias de ADN de SLFs y S-RNasas recientemente aisladas han sido depositadas en el Banco
de Datos de ADN de Japón (DDBJ) bajo las accesiones AB932964 a AB933144. Ver la Tabla Suplementaria 1 y 8 para
la correspondencia entre los nombres de los genes y los números de acceso.

Nota agregada en la prueba: durante este artículo, Williams et al 50 informaron la identificación independiente de 17
tipos de SLF en dos haplotipos S de P. in fla. Sus datos respaldaron nuestra observación de que 16-20 SLF son su fi
cientes para el sistema de no autorreconocimiento en Petunia SI.

Agradecimientos
Agradecemos a H. Takatsuji en el Instituto Nacional de Ciencias Agrobiológicas por P. hybrida cv. Mitchell y W138;
S. Saha en la Universidad de Cornel para obtener instrucciones sobre la información genómica de Solanum; Sr. H. Iwano
Shiba, H. Shimosato-Asano, Y. Wada, K. Murase, el Sr. E. Kakita Miura, T. H. Kakui Tsuchimatsu y Robinson para el
debate o asesoría técnica; y F. Kodama, M. Okamura, E. Mori, Y. Goto, H. Kikuchi y Functional Genomics Center
Zurich para asistencia técnica. Te agradecemos T-h. Kao en la Universidad Estatal de Pensilvania por adaptarse a una
nueva nomenclatura para los nuevos genes SLF antes de la publicación. Este trabajo fue apoyado en parte por una
subvención-en-Ayudas a la científica Investigación fi co en áreas innovadoras (23113002) y por subvenciones-en-
Ayudas a Scientific Research (21248014, 25252021) del Ministerio de Educación, Cultura, Deportes, Ciencia y
Tecnología de Japón Otorgado a ST fue aussi Este trabajo apoyado en parte por la Fundación Nacional de Ciencia de
Suiza (31003A_140917) y por RUPP de la Evolución en la Universidad de Zurich Acción Otorgado a KKS, Marie Heim
Vögtlin subvención concedida a RS-I. y por Plant Fellows otorgado a T.P.

Contribuciones del autor


K-i.K., K.K.S. y S.T. planificó y diseñó la investigación. K-i.K. y bibliotecas de ADNc de polen construidas con T.E.
M.H. y R.S. realizó la secuenciación de próxima generación y la construcción de bases de datos EST. K-i.K. y K.K
realizó el aislamiento y la secuenciación de Sanger de cDNA y clones genómicos. K-i.K. y A.T realizó la construcción
y el análisis de plantas transgénicas. K-i.K. y T.P. realizaron análisis filogenéticos y evolutivos. K-i.K. y M.T. realizaron
un análisis de ligamiento y un perfil de expresión. M.H. y K.K.S. diseñó modelos matemáticos y realizó simulaciones.
S.T. inició y guió el proyecto. K-i.K., T.P., M.H., K.K.S. y S.T. escribió el manuscrito.
Información adicional
La información complementaria está disponible en línea. La información sobre reimpresiones y permisos está disponible
en línea en www.nature.com/reprints. La correspondencia y las solicitudes de materiales deben dirigirse a K.K.S. y S.T.

Conflicto de intereses
Los autores declaran no tener intereses financieros en competencia.

NOTA AL PIE PAG 1


1 Escuela de Graduados de Ciencias Biológicas, Instituto de Ciencia y Tecnología de Nara, Ikoma 630-0192, Japón.
2Instituto de Biología Evolutiva y Estudios Ambientales, Universidad de Zurich, CH-8057 Zurich, Suiza. 3Functional
Genomics Center Zurich, CH-8057 Zurich, Suiza.
* correo electrónico: kentaro.shimizu@ieu.uzh.ch; takayama@bs.naist.jp
PLANTAS DE NATURALEZA | VOL 1 | ENERO 2015 | www.nature.com/natureplants

EXPLICACION DE LOS GRÁFICOS


Figura 1 | Filogenias de SLFs y S-RNasas de Petunia. a, b, Vecino
Los árboles filogenéticos de las secuencias de aminoácidos deducidas de los genes SLF (a) y S-RNase (b) se crearon
con MEGA5 (ref 48). Ambos árboles se muestran en la misma escala; la barra para cada árbol indica el número de
sustituciones de aminoácidos por sitio. Se usó PpS4-Fbox0 (a) o PpS4-RNasa (b) como un grupo externo. Los números
en las ramas indican valores de arranque > 50% con 1,000 ensayos. Para simplificar, los subgrupos (SLF alélicos) dentro
de un solo tipo de SLF se muestran en una representación comprimida (triángulos negros). El árbol completo de los SLF
aparece en la Fig. 1.

Figura 2 | Relaciones entre las filogenias de los SLFs y las interacciones SLF / S-RNasa. a-c, árboles filogenéticos
de unión de vecinos de secuencias de aminoácidos deducidas de SLF de tipo 3 (a), tipo 9 (b) y tipo 1 (c). Para la creación
y explicación de árboles filogenéticos, vea la leyenda para la Fig. 1. Las flechas de dos cabezas indican interacciones
positivas entre SLFs y S-RNasas, que conducen a la aceptación, ensayo in vivo. Las líneas de puntos grises indican
interacciones negativas, que no conducen a la aceptación del polen. Los caracteres rojo y azul se ven relativamente
afectados por SLFs y sus S-RNases afines, que son el objetivo de los SLFs conservados.

Figura 3 | Target S-RNase análisis de S5-SLF3. a-d, la compatibilidad se juzgó controlando los tubos de polen (punta
de flecha) 9. a, S5S9-heterocigoto con S5-SLF3 retuvo SI. Se obtuvieron resultados similares para heterocigotos con
haplotipos S11-, S17- y S19 (Figura 5 complementaria), lo que sugiere que S5-SLF3 no reconoció ninguna de estas S-
ARNasas. b, los transformantes S5S7 / S5-SLF3 (T) exhibieron la descomposición de SI.c,d Los cruces recíprocos con
S5S7 (WT) sugieren que el polen perdió SI. e, genotipado de PCR de la progenie F1 de WT × T f, explicación
esquemática de los resultados en. Entre el polen genotípico de T, solo el polen S7 con S5-SLF3 se fecundó con éxito,
lo que sugiere que S5-SLF3 desintoxica la S7-RNasa. Barras de escala = 200 μm.

Figura 4 | Filogenias y localización pericentromérica de solanáceas SLFs y S-RNasas. a, b, filogenias de secuencias


de aminoácidos deducidas de SLFs (a) y S-RNasas (b). Los símbolos indican que el gen se deriva del género: Petunia
(círculo rosa), Solunum (triángulo azul) y Nicotiana (cuadrado verde). Los SLFs alécticos colapsados en cada clado se
denotan con triángulos negros. c, cromosoma 1 de Solunum. Flechas rojas, regiones S-locus; líneas azules gruesas,
regiones pericentroméricas; líneas rojas, SLFs; línea azul, S-RNase; líneas negras, genes F-box fuera del clado SLFs;
ψ, pseudogenes. La S-RNasa de la patata se localiza en el cromosoma 1, pero no se mapea debido a un probable error
de ensamblaje. Para la abreviatura del nombre del gen, ver Métodos.

Figura 5 | Estimación de la proporción de S-RNasa reconocida por múltiples tipos de SLF, a- El resultado de un
proceso de Bernoulli aplicado a la estimación, basado en la suposición de que cada tipo de SLF reconoce S-RNases
alélicas independientemente con la misma probabilidad. Las barras de error indican intervalos confidenciales del 95%
estimados usando la ecuación (3) en Métodos.b Los resultados de una simulación Monte Carlo condujeron a la diferencia
en la proporción de reconocimiento de RNasa entre los tipos de SLF. Las barras de error indican la desviación estándar
estimada a partir de la simulación Monte Carlo. Las líneas horizontales azules y moradas indican el 95% y el 100% de
los productos alélicos de S-RNasa, respectivamente. Las líneas verticales punteadas indican n = 16, 18 y 20.

Figura 6 | Modelo para la evolución de los SLFs. a, eventos de recombinación y sus consecuencias esperadas. Posibles
escenarios evolutivos para tres haplotipos antiguos (S1a, S2a y S3a) están indicados. Los óvalos y las casillas indican
SLFs y S-RNases, respectivamente. S2a y S3a-RNasas pero no S1-RNasa. Los colores más claros indicarán haplotipos
extintos. Filogenias predictivas de SLFns alélicas (superiores) y S-RNasas (inferiores) de haplotipos SI S existentes (S1,
S2, S3 y S4) y haplotipos S de SC (S2m), cuyos escenarios evolutivos se simulan en.

You might also like