You are on page 1of 6

Gramticaformal

DeWikipedia,laenciclopedialibre
Una gramtica formal es una estructura matemtica con un
conjunto de reglas de formacin que definen las cadenas de
caracteres admisibles en un determinado lenguaje formal o
lengua natural. Las gramticas formales aparecen en varios
contextos diferentes: la lgica matemtica, las ciencias de la
computacin y la lingstica terica, frecuentemente con
mtodoseinteresesdivergentes.
Enunlenguajeformal,alascadenasformadassegnlasreglas
delagramticaformalselasllamafrmulasbienformadas,yel
conjunto de todas las frmulas bien formadas constituye un
lenguaje formal. Una gramtica formal no describe el
significado de las frmulas bien formadas, sino solamente su
forma. La teora de los lenguajes formales estudia las
gramticasformalesyloslenguajesformales,yesunaramade
la matemtica aplicada. Sus aplicaciones se encuentran en la
ciencia computacional terica, la lingstica, la semntica
formal,lalgicamatemticayotrasreas.

ndice
1Introduccin
2Gramticasformalesenlingsticaterica
2.1DefinicindeunaCgramtica
2.2DefinicindeunaESgramtica
2.3Derivaciones
2.3.1JerarquadeChomsky
2.4Limitacindelasgramticasformales
3Gramticasformalesenmatemticasylgica
4Vasetambin
5Referencia
5.1Bibliografa

Estaimagenmuestralarelacinentre
lascadenasdecaracteres,lasfrmulas
bienformadasylosteoremas.En
algunossistemasformales,sin
embargo,elconjuntodelosteoremas
coincideconeldelasfrmulasbien
formadas.

Introduccin
Una gramtica formal es un conjunto de reglas para reescribir cadenas de caracteres, junto con un
smbolo inicial desde el cual debe comenzar la reescritura. Por lo tanto, una gramtica formal
generalmente se piensa como una generadora de lenguajes. Sin embargo, a veces tambin puede ser
usada como la base para un "reconocedor": una funcin que determina si una cadena cualquiera
perteneceaunlenguajeoesgramaticalmenteincorrecta.
Hay distintos tipos de gramticas formales que generan lenguajes formales (vase la jerarqua de
Chomsky).Imaginemosunagramticaconestasdosreglas:
1. AbA

2. Ac
El elemento en maysculas es el smbolo inicial. Los elementos en minsculas son los smbolos
terminales.Paragenerarcadenasdecaracteres,laideaessustituirelsmboloinicialdelaizquierdapor
los smbolos de la derecha, y luego repetir el proceso hasta que slo haya smbolos terminales. Por
ejemplo:
AbAbbAbbbAbbbc
Esta gramtica da lugar a un lenguaje formal que consiste en el conjunto de todas las cadenas de
caracteresquepuedensergeneradaspormedioellas.Porejemplo:bbbc,bbbbbbbbc,c,bc,etc.
Paracomprendermejorlaidea,podemosconsiderarunmodelodereescrituraparaelespaol:
1. OSUJPRED(OracinSujetoPredicado)
2. SUJDetN(SujetoDeterminanteNombre)
3. PREDVCOMP(PredicadoVerboComplemento)
4. Detel
5. Nnio,(hombre,anciano)
6. Vduerme,(re,come)
7. COMPplcidamente,(intranquilo)
Estasreglaspuedenutilizarseparagenerarlafrase"elnioduermeplcidamente",as:
1. O(smboloinicial)
2. SUJ(ETO)PRED(ICADO)(porlaregla1)
3. Det(erminante)N(OMBRE)PRED(ICADO)(porlaregla2)
4. Det(erminante)N(OMBRE)V(ERBO)COMP(LEMENTO)(porlaregla3)
5. elN(OMBRE)V(ERBO)COMP(LEMENTO)(porlaregla4)
6. elnioV(ERBO)COMP(LEMENTO)(porlaregla5)
7. elnioduermeCOMP(LEMENTO)(porlaregla6)
8. elnioduermeplcidamente(porlaregla7)
Vemos que existen unas definiciones especiales como FRASE, SUJETO, etc. que no aparecen en la
frase final formada. Son unas entidades abstractas denominadas "categoras sintcticas" que no son
utilizables en una oracin (tienen un papel similar al de las categoras gramaticales de las lenguas
naturales).Eigualmenteelmismosistemapermitederivarotrasoracionessimilaresusandoformaslas
formaslxicasentreparntesis:
Det

COMP

nio duerme
plcidamente
El hombre re
intranquilo
anciano come
Las categoras sintcticas definen la estructura del lenguaje representando porciones ms o menos
grandesdelasfrases.Existeunajerarquainternaentrelascategorassintcticas.
LacategorasuperiorseralaFRASEquerepresentaunaoracinvlidaenlenguacastellana.
Pordebajodeellaseencuentransuscomponentes.Ningunadeestascategorasdanlugarafrasesvlidas
sololacategorasuperior.

Alfinalizartodalajerarquallegamosalaspalabrasquesonlasunidadesmnimasconsignificadoque
puedeadoptarunafrase.
Aplicando las jerarquas y sustituyendo elementos, llegamos al punto en donde todas las categoras
sintcticassehanconvertidoenpalabras,obteniendoportantounaoracinvlidacomoporejemplo:El
niocorre.Esteprocesosellamaproduccinogeneracin.

Gramticasformalesenlingsticaterica
Unagramticaformalesunmodelomatemtico(msexactamenteunaestructuraalgebraica)compuesto
porunaseriedecategorassintcticasquesecombinanentrespormediodeunasreglassintcticasque
definen cmo se crea una categora sintctica por medio de otras o smbolos de la gramtica. Existen
variostiposdegramticasformaleshistricamenteimportantes:
Lasgramticasformalescategoriales (Cgramticas) que usan un anlisis de abajo a arriba y
requierenelusodeetiquetasdecategoraparacadasecuenciaformadaoconstituyentesintctico
propiamentedicho.Existeunanicacategorasuperiorquedenotacadenascompletasyvlidas.
Lasgramticasdeestructurasintagmtica(ESgramticas,eninglsPSgrammars)basadasen
reglasdereescriturayconunanlisisdearribaabajo.AligualquelasCgramticassebasanenla
nocindeconstituyentesintctico.
Lasgramticasasociativas(porlaizquierda)(Agramticas,eninglsLAgrammars),queusa
usa un anlisis de abajo a arriba, que permiten un anlisis en de complejidad lineal, aunque
ignoranelconceptodeconstituyentesintctico.
Los dos primeros tipos tienen puntos de conexin obvia con la nocin de constituenciasintctica y el
anlisis mediante rboles sintcticos. Sin embargo, los analizadores sintcticos para las oraciones
formadassegnellasnopuedenbasarseenlasreglasdegeneracin(asimetrahablanteoyente),locual
sugiere que no puedan ser buenos modelos de la intuicin de los hablantes. Adems los modelos de
lengua natural basados en ellas parecen tener una complejidad polinmica o exponencial, lo cual no
pareceavenirseconlavelocidadconqueloshablantesprocesanlaslenguasnaturales.PorcontralasA
gramticas en general tienen complejidad lineal, simetra entre hablantes y oyentes, sin embargo,
ignoran los constituyentes clsicos del anlisissintctico. Sin embargo, siguen siendo usadas para los
analizadoressintcticosusadosencomputacin.
Pormediodeestoselementosconstituyentessedefineunmecanismodeespecificacinconsistenteen
repetir el mecanismo de sustitucin de una categora por sus constituyentes en funcin de las reglas
comenzandoporlacategorasuperioryfinalizandocuandolaoracinyanocontieneningunacategora.
De esta forma, la gramtica puede generar o producir cada una de las cadenas del lenguaje
correspondienteysoloestascadenas.

DefinicindeunaCgramtica
UnagramticacategorialoCgramticaesunabasadaencategorasgramaticales.Lasformaslxicasy
secuencias formadas a partir de ellas estn etiquetadas con categoras que indican el tipo de entidad
formada y sus posibilidades combinatorias (por ejemplo en una lengua nominal una secuencia de
palabraspuedeconstituirunsintagmanominallocualespecificaconquotrotipodecategoraspuede
combinarseestesintagmaparaformarotrosintagmamayor).
Las gramticas categoriales se pueden definir como una estructura formal algebraica. Una gramtica
categorialesunquntupla
conlassiguientespropiedades:
1.

(words)eselconjuntonovacodeformasbienformadasdelalengua(enunalenguanaturalW

podrainterpretarsecomosecuenciasdefonemasqueformanexpresiones,irrespectivamentedesu
categoragramatical).
2. (categories) es el conjunto no vaco de categoras posibles. Para que este conjunto sea un
conjuntodecategorasaceptableseexigequesi
entoncestambinexistanlascategoras
(frecuentementedenotadatambincomoY/X)y
(frecuentementedenotadatambin
comoY\X).Ntesequedeloanteriorsedesprendelaexistenciadelascategoras
y
(sinmsqueintercambiarelpapeldeXeY).
3. Elconjunto (lexicon)esunconjunto
, este conjunto es algo diferente del lexicn
convencionalyaqueincluyetantopalabrasatmicasinanalizablescomoexpresionesformadasa
partirdeellas.
4. El conjunto (rules) es un conjunto de reglas, generalmente formado por las siguientes dos
reglas:
1.
2.
Las anteriores se aplican a cualesquiera categoras y se interpretan as: si en un lenguaje
formal los elementos a la izquierda de la regla pertenecen al lexicn
, entonces la
expresin a la derecha de la regla tambin es parte del lexicn (es decir, del conjunto de
expresiones posibles en dicho lenguaje). Se comprende que puesto que la composicin
puede ser por la izquierda (regla 1) o por la derecha (regla 2) se haya requerido que el
conjunto admitaademsdecategoras e lascategoras y .
5. Elconjunto

(completeexpresions)

DefinicindeunaESgramtica
En la definicin clsica que dio Noam Chomsky en la dcada de 1950, una gramtica formal de
estructurasintagmtica(ESgramtica)esunacudruplaG=(N,T,S,P)donde:
Nesunconjuntofinitodesmbolosnoterminales(variables).
Tesunconjuntofinitodesmbolosterminales(constantes),disjuntoconN.
SesunsmbolodistinguidodeN,elsmboloinicial.
Pesunconjuntofinitodereglasdeproduccin,cadaunadelaforma:

donde*eslaclausuradeKleene.Estoes,cadaregladeproduccinmapeadeunacadenadesmbolosa
otra,dondelaprimeracadenacontienealmenosunsmbolonoterminal.Enelcasodequelasegunda
cadenasealacadenavaca,paraevitarconfusinseladenotaconunanotacinespecial(usualmente ,
o ).
Elalfabetodelagramticaesentonceselconjunto

Derivaciones
Sea

unagramtica,ysean,,,,,...palabrasde

.Entonces:

sederiva de en un paso de derivacin, y lo denotamos con si existen dos cadenas


,yunaproduccintalesque= ,y=
Notamoscon
alcierrereflexivoytransitivode .Esdecir
denotaaunasecuencia
dederivacionesenunnmerofinitodepasosdesdehasta.
esunaformasentencialde ,sipuedeobtenerselasiguientesecuenciadederivaciones
.Enelcasoparticulardeque
sedicequexesunasentencia

SedenominalenguajeformalgeneradoporGalconjunto
JerarquadeChomsky
CuandoNoamChomskyformalizlaideadelasgramticasgenerativasen1956,clasificestetipode
gramticas en varios tipos de complejidad creciente que forman la llamada jerarquadeChomsky. La
diferencia entre estos tipos es que cada uno de ellos tiene reglas ms particulares y restringidas y por
tanto generan lenguajes formales menos generales. Dos tipos importante son las gramticas libres de
contexto (Tipo 2) y las gramticasregulares (Tipo 3). Las lenguas que pueden ser descritas mediante
esostiposdegramticassonlenguaslibresdecontextoylenguasregulares,respectivamente.Estosdos
tipossonmuchomenosgeneralesquelasgramticasnorestringidasdeTipo0(esdecir,quepuedenser
procesadas o reconocidas mediante mquinas de Turing). Estos dos tipos de gramticas se usan ms
frecuentemente puesto que los analizadores sintcticos para estos lenguajes pueden implementarse de
manera eficiente.1 Por ejemplo, todas las lenguas regulares pueden ser reconocidas por un autmata
finito.Parasubconjuntosdegramticaslibresdecontexto,existenalgoritmosparageneraranalizadores
sintcticos LL y analizadores sintcticos LR eficientes, que permiten reconocer los correspondientes
lenguajesgeneradosporesasgramticas.

Limitacindelasgramticasformales
Las ESgramticas como la usada en los primeros modelos de gramtica generativa requieren ciertas
restriccionesparasercomputacionalmentetratables.Paraentenderesarestriccindebeconsiderarsela
interaccinentreunhablanteyunoyente,elprimerogeneraunaoracinosecuenciadeacuerdoconlas
reglas de la gramtica, el segundo para entender dicha secuencia debe analizar la secuencia para
entenderla, encontrando los elementos formantes, interpretndolos y reconstruyendo la relacin hay
entre ellos (estructura interna). Para que eso segundo sea posible se requiere que la estructura interna
tengaunaestructurasuficientementesimplecomopoderanalizarsintcticamentelassecuenciasconun
bajogradodeambigedad.Puesbiencomputacionalmentesehaencontradoquelaclasedecomplejidad
frente al anlisis inverso de ciertas gramticas es excesiva. Para ESgramticas basadas en reglas de
reescriturasetiene:
Restricciones
enlasreglas

Tipode
ESgramtica

Tipode
lenguaje

Gradode
complejidad

tipo3

GramticaESregular

lenguajesregulares

lineal

tipo2

GramticaES
libredecontexto

lenguajeslibres
decontexto

polinmica

tipo1
tipo0

GramticaES
lenguajesdependientes
dependientedelcontexto
delcontexto
GramticaES
norestringida

exponencial

lenguajesrecursivamente
indecidible
enumerables

Gramticasformalesenmatemticasylgica
Dentro del enfoque formalista y axiomtico de las matemticas se concibi que ciertas reas de las
matemticaspodanconcebirsecomounsistemalgicodeductivodefrmulassujetasarestriccionesde
manipulacin.Lagramticaformaldeesossistemasseraelconjuntodereglascombinatoriasacordesa
ciertosprincipiosdeductivos.

Un lenguaje formal en lgica o matemticas es una tripleta


donde denota el alfabeto o
conjunto de signos usados, el conjunto de reglas explica qu combinaciones de signos estn bien
definidasypermitedefinirloqueesunafrmulabienformada(enesesentido definelamorfologa
delaspalabrasdelalenguaformal).Elconjuntodefrmulasbienformadasconstituyenelvocabularioo
lxico, mientras el par
describe el conjunto de axiomas y el conjunto de reglas de deduccin
vlidas. Estas dos ltimas permiten establecer secuencias de frmulas bien formadas (palabras del
lenguaje formal) que constituyen demostraciones vlidas dentro del sistema formal (son de alguna
maneraelequivalentealasintaxisdelalenguaformal).

Vasetambin
JerarquadeChomsky
Analizadorsintctico

Referencia
1. Grune,Dick&Jacobs,CerielH.,ParsingTechniquesAPracticalGuide,EllisHorwood,England,1990.

Bibliografa
Hausser, Roland R. (1999). Foundations of Computational Linguistics (en ingls). SpringerVerlag.
ISBN3540660151.
Obtenidodehttp://es.wikipedia.org/w/index.php?title=Gramtica_formal&oldid=78040313
Categoras: Lenguajesformales Lingsticacomputacional
Estapginafuemodificadaporltimavezel9nov2014alas12:10.
EltextoestdisponiblebajolaLicenciaCreativeCommonsAtribucinCompartirIgual3.0
podranseraplicablesclusulasadicionales.Lanselostrminosdeusoparamsinformacin.
WikipediaesunamarcaregistradadelaFundacinWikimedia,Inc.,unaorganizacinsinnimo
delucro.

You might also like