You are on page 1of 9

MANUAL PARA EL USO DE STATA 12/14

PARA PRINCIPIANTES

Juan Carlos Vázquez Almaraz y Nora Nidia Garro Bordonaro

1ª versión

Septiembre de 2016

1
Contenido
Introducción ........................................................................................................................................ 3
Ventanas de Stata 12. ......................................................................................................................... 3
Tipos de archivos de Stata................................................................................................................... 5
Sintaxis básica de los comandos: ........................................................................................................ 7

2
Introducción
El objetivo de este tutorial es brindar al lector los elementos básicos para el manejo del
programa econométrico Stata, en particular para el análisis de datos, la realización de
estadísticas descriptivas, elaboración de grafica y análisis de regresión.

Se sugiere al lector seguir un enfoque de tipo práctico, es decir, no se puede aprender a usar
Stata, ni algún otro programa, únicamente leyendo, es necesario avanzar en la lectura del
tutorial y tener enfrente la computadora con el programa abierto con alguna base de datos,
esto le permitirá utilizar y poner en práctica los comandos conforme se vayan conociendo y
aprendiendo. Subrayamos que, en Stata, las diferentes acciones se pueden realizar a través
de varios caminos, en este tutorial enfatizamos el uso de comandos más que el uso
tradicional de ventanas (aunque al principio los combinamos para apreciar las alternativas
de funcionamiento). Diversos autores reconocen que, si bien al principio, esto tiene un
costo por el tiempo que hay que dedicar al aprendizaje de los comandos, cuando estos se
han aprendido se obtiene la recompensa por el ahorro de tiempo en tareas posteriores.

En este documento hacemos uso de la versión 12 del programa y suponemos que ya se


cuenta con una versión instalada en su computadora, lo que implica una licencia del
programa, de manera que para abrirlo sólo es necesario buscar el icono correspondiente en
el escritorio y dar doble click con el botón izquierdo. Una forma alternativa es ir a Inicio >
Programas y buscar hasta ubicar la versión de Stata y oprimir para abrir. Comenzaremos,
pues, con la descripción de las diversas ventanas.

Ventanas de Stata 12.


Ventana de comandos.- En esta ventana se introducen los comandos que indican al
programa la acción que se pretende, y sobre qué variables se quieren, realizar. Como
veremos más adelante los comandos pueden ser ejecutados sobre todas las variables en
nuestra base de datos, sobre algunas de ellas y sobre una parte selecta de las mismas. Se
recomienda desde el inicio abrir un do-file donde se guarden todos los comandos y ordenes
ejecutadas por el programa. Más adelante indicamos la forma de crear este tipo de archivos.
Ventana de resultados.- En esta ventana se aprecian todas las acciones que se han solicitado
y los resultados correspondientes. Como en el caso anterior se sugiere crear un log-file en el
cual queden registrados todos los resultados obtenidos, también veremos más adelante la
forma de crear estos archivos.
Ventana de review.- Esta ventana está destinada a registrar únicamente los comandos
introducidos en la ventana correspondiente.
Ventana de variables.- Aquí podemos encontrar todas las variables que contiene nuestra
base de datos corriente o actual.

3
Ventana de propiedades.- Finalmente, en esta ventana podemos apreciar diversos detalles
de cada una de las variables contenidas en nuestra base de datos actual, las características
van cambiando conforme se cambie de variable en la ventana de variables.

En la parte superior de la pantalla aparece el icono del programa indicando la versión que
se está utilizando, en nuestro caso es la versión 12, seguido por la ruta para el archivo en
uso. Enseguida, como es usual, en el ambiente Windows, aparece la fila de menús
desplegables con la distribución tradicional de file, edit, data, etc., y que muestra todas las
acciones que pueden ser realizadas por el programa. Más abajo aparece los iconos de las
acciones que son más frecuentemente realizadas en el programa, como pueden ser abrir,
grabar, imprimir y algunos otros.
Ahora que sabemos la que contiene cada una de las ventanas de nuestro programa es
momento de hacer algunos comentarios adicionales.

Para realizar un buen proyecto de investigación es necesario contar con las bases de datos
apropiadas. Este tipo de bases permiten aproximar las variables que la teoría económica
señala para analizar las relaciones económicas correspondientes. Ya que se cuenta con
dichas variables, se recomienda iniciar explorando las propiedades y características de las
series a nivel individual, o el análisis univariado de las series individuales que debe
preceder al análisis multivariado o de sistema. Adicionalmente se sugiere crear dos tipos de
archivos. Uno de ellos debe ser un do-file. Este archivo nos permite guardar todos los
comandos que sean implementados en nuestra investigación econométrica y nos permite

4
agregar todo tipo de comentarios después de un asterisco. Por ejemplo: “*Esta es una
prueba”. Con un archivo de este tipo lo que logramos es la reproducibilidad de nuestra
investigación. Es decir, si dentro de una semana, un mes o un año deseamos reproducir
nuestra investigación no tendremos ningún problema en repetirla y con los comentarios que
hayamos agregado, podemos asegurarnos de comprender todos y cada uno de los pasos
realizados. Otro tipo de archivo que se sugiere crear es un log-file. En este archivo
nosotros podremos guardar todos los resultados de nuestro proyecto. Además, tenemos la
opción de guardarlo con una extensión scml con lo cual es imposible modificar el archivo o
bien con formato de texto (txt) con lo que podríamos editar de ser necesario.

Tipos de archivos de Stata


Stata utiliza y crea diversos tipos de archivos, estos son distinguibles por la extensión al
final:
.dta Archivos de datos en formato de Stata
.raw Archivo de datos en código ASCII
.dct Diccionario de datos, opcional con infile
.do Archivos que ejecutan un conjunto de comandos
.log Resultados guardados como texto plano por el comando log using
.smcl Resultados guardados en formato smcl por el comando log using
.ado Programas que agregan comandos
.gph Graficas guardadas en formato de Stata
.wmf Graficas guardadas como metafiles de Windows
.hlp Texto que se muestra cuando se utiliza la ayuda

Los archivos más importantes para nosotros en esta etapa, en la cual vamos a aprender a
utilizar el programa, son los archivos con extensión .dta, .do, y .log. El primero contiene
nuestras bases de datos, el segundo permite guardar los diversos comandos utilizados y, el
último, permite guardar todos los resultados obtenidos.

Se recomienda, antes de iniciar cualquier proyecto de investigación econométrico, crear


cuatro carpetas. En una de ellas se sugiere colocar las bases de datos originales (base_orig).
En otra las bases de datos conforme se vayan modificando (base_modif). En la tercera y
cuarta carpetas se propone destinarlas para los do-file y los log-file (do-files y log-files),
respectivamente.

En el caso de las bases originales se garantiza que, aunque realice alguna modificación,
siempre las tendrá disponibles en su forma original para la contrastación. En el caso de los
do-file permitirá la reproducibilidad, es decir, que en el futuro, en una semana, en un mes o
en un año, siguiendo el do-file sea posible replicar el proceso que se había realizado. En el

5
caso de los log-file también va a permitir examinar y comparar los resultados previos a los
que se había llegado con los que pueda realizar en el futuro.

Como veremos en el transcurso de este tutorial para hacer las cosas en Stata pueden existir
diferentes formas o caminos. Por ejemplo, para crear nuestro do-file podemos recurrir a los
menús, también a uno de los íconos más utilizados o bien, conforme se aprendan, a
combinaciones de teclas. En el primer caso la ruta a seguir es la siguiente: Window > Do-
file editor > New Do-file editor, en el segundo caso podemos oprimir el séptimo ícono de
izquierda a derecha y, finalmente, simplemente con ctrl+9. En cualquiera de los tres casos
el resultado es el mismo. Antes de iniciar su uso es necesario guardarlo, con el nombre que
usted prefiera, de la forma acostumbrada. En este caso File > Save as..nombre o bien de
forma directa con Ctrl+Shift+S. Antes de terminar su sesión no olvide guardar y cerrar su
archivo.

El otro archivo que es de suma importancia es un log-file. En este archivo se van a registra
todos los comando y los resultados que se obtengan de la aplicación de dichos comandos.
Para crear un log-file podemos seguir la ruta: File > Log > Begin, enseguida deberá
seleccionar el lugar donde lo quiere guardar. La forma alternativa es oprimiendo el cuarto
ícono, de izquierda a derecha, debajo de la fila de menús. Antes de concluir su sesión no
olvide cerrar su archivo siguiendo la misma ruta: File > Log > Close.

Supongamos un caso inicial empleando una base de datos de nuestro propio programa, en
este caso podemos utilizar la base de datos llamada: auto. Para tener un panorama de la
base completa lo podemos hacer por diversas vías pero lo rimero que hay que hacer es tener
la base de datos en la sesión actual. Si seguimos el tradicional ambiente de ventanas el
procedimiento es el siguiente: File > Example Datasets > Example Datasets Installed
with Stata > auto.dat. Este camino se puede acortar si únicamente escribimos en la
ventana de comandos la siguiente instrucción.

.sysuse auto
Después de introducir este comando nos arroja el siguiente enunciado y se ha cargado la
base solicitada en nuestra sesión actual.
. sysuse auto.dta

(1978 Automobile Data)

Para contar con una panorámica completa de nuestra base de datos podemos abrir tipo hoja
de cálculo de la siguiente manera: Data > Data Editor con dos opciones, una para editar >
Data Editor (Edit) y otra para navegar > Data Editor (Browse). En el primer caso es
posible modificar de forma directa alguna, o algunas, observaciones, en tanto que, en el
segundo caso, sólo podemos ver sin modificar. Dos formas alternativas son el 8º y 9º ícono
o bien con ctrl+8, finalmente podemos escribir en la ventana de comandos browse. Si lo

6
que se desea es modificar la base de datos entonces la abrimos con edit. Como es obvio
esta es una panorámica muy general que no aporta mucho para el análisis de los datos. El
programa cuenta con toda una serie de opciones mediante las cuales es posible realizar
dicho análisis de datos.

Para estos momentos podemos comenzar a utilizar los diversos comandos como una
manera mucho más práctica y eficiente de aprovechar las capacidades del programa. Para
lograr lo anterior es menester aprender la sintaxis de las órdenes o comandos. En Stata
dicha sintaxis es la siguiente y explicamos cada uno de los componentes:

Sintaxis básica de los comandos:


[prefix: ] command [varlist] [= exp] [if exp] [in exp] [weight] [using filename] [, options]

prefix denota un comando que repite la ejecución del comando o que modifica el input o el
output del comando

command denota el comando

varlist denota una o varias variables

exp es una expresión matemática

if o in condiciona la aplicación del comando a una cierta condición

weight denota una ponderación

filename es el nombre del archivo

options denota una o más opciones que se aplican al comando en ejecución

Todo lo que aparece entre corchetes es opcional. Es decir, la parte obligatoria es el nombre
del comando. Por ejemplo, si únicamente colocamos el comando y agregamos el nombre de
una variable, o lista de variables, esta acción se ejecutará sobre dichas variables, en caso de
no agregar el nombre de variable alguna el programa asume que debe aplicar la orden a
todas las variables incluidas en la base de datos. Si se incluye if, esto establece la aplicación
del comando cuando se cumple una cierta condición y se puede introducir expresiones de
tipo lógico. En caso de agregar in, nos podemos referir a la aplicación del comando
respectivo a un cierto rango de datos.

Para facilitar nuestro ejercicio en esta primera etapa de nuestro aprendizaje recordemos que
se ha cargado una base de datos que ya está incluida en Stata. Podemos iniciar solicitando
que nos describa las características de la base de datos.

.describe

7
El resultado es el siguiente. En este caso se aprecia que la base está compuesta por 12
variables y 74 observaciones para cada una de las variables. Corresponde a una base de
datos de automóviles para el año de 1978 y la última vez que fue modificada fue el 13 de
abril de 2011. Además del nombre de cada variable podemos ver el tipo de
almacenamiento, las etiquetas para cada variable y las etiquetas de valor.

. describe
Contains data from C:\Users\Multiapoyo\Desktop\Stata 12\ado\base/a/auto.dta
obs: 74 1978 Automobile Data
vars: 12 13 Apr 2011 17:45
size: 3,182 (_dta has notes)
---------------------------------------------------------------------------------
--------------
storage display value
variable name type format label variable label
---------------------------------------------------------------------------------
--------------
make str18 %-18s Make and Model
price int %8.0gc Price
mpg int %8.0g Mileage (mpg)
rep78 int %8.0g Repair Record 1978
headroom float %6.1f Headroom (in.)
trunk int %8.0g Trunk space (cu. ft.)
weight int %8.0gc Weight (lbs.)
length int %8.0g Length (in.)
turn int %8.0g Turn Circle (ft.)
displacement int %8.0g Displacement (cu. in.)
gear_ratio float %6.2f Gear Ratio
foreign byte %8.0g origin Car type
---------------------------------------------------------------------------------
--------------
Sorted by: foreign

Dado que podría no ser de su agrado el orden en el cual aparecen las variables en la ventana
correspondiente se puede optar por modificarlo. Esto lo puedo hacer de la siguiente forma,
con el comando order seguido de los nombres de las variables en el orden que es de su
interés.
.order rep78 price trunk make
Así mismo se puede utilizar:
.move trunk turn
Note que si por alguna razón repitiera el mismo comando las variables regresan a su orden
original.
Si se pretende optar por ordenar las variables de manera alfabética se aplica el siguiente
comando sin necesidad de agregar los nombres de las variables.
.aorder
También puede ocurrir que a usted no le haga falta tener en la base de datos actual todas las
variables sino únicamente algunas de ellas, con los dos comandos siguientes es posible
descartar variables o indicar que mantenga algunas de ellas. Para descartar sólo debe
escribir el nombre del comando seguido por el nombre de la o las variables que hay que
descartar.

8
.drop headroom gear_ratio
Para mantener en la base una selección particular de variables el nombre del comando es
seguido por la lista de variables.
.keep foreign make mpg price rep78 weight turn
A partir de este número reducido de variables podemos implementar el uso de algunos otros
comandos para el análisis de datos.
Suponga que desea las estadísticas más básicas sobre sus diferentes variables, en este caso
el tamaño de la muestra, el valor mínimo y máximo y la desviación estándar se obtiene con:
.summarize
Recuerde que si no se agrega ningún nombre de variables al comando, el programa ejecuta
la acción para todas las variables que encuentre en la base de datos. En caso de que sólo se
solicite esta información para algunas variables habrá que agregar los nombres.
.summarize foreign mpg rep78
Si usted quiere información adicional puede agregar la opción detail.
.summarize foreign mpg rep78, detail
Como puede notar la información que se agrega corresponde a los cuatro valores más
grandes y más pequeños para cada variable y los percentiles correspondientes así como la
varianza, asimetría y kurtosis. Sin embargo, también puede notar que esto consume
demasiado espacio en nuestra ventana de resultados de manera que es poco práctico. No
obstante si se requiere este tipo de información es mejor utilizarlo para variables
particulares o específicas. Otros comandos con funciones similares son.
.codebook price
Que nos muestra los percentiles, media y desviación estándar, mínimo y máximo (rango),
tamaño de la muestra y nos agrega la información sobre si existen datos perdidos en esta
variable. Otro comando es.
.inspect price
En este caso nos muestra los valores negativos, cero y positivos, enteros y no enteros y una
gráfica.

You might also like