Raul E. Lopez Briega

Matemáticas, análisis de datos y python

Introducción a Finanzas con Python

Introducción a Finanzas

Introducción

En el vertiginoso mundo actual de las finanzas; dónde la velocidad, frecuencia y volumen de los datos aumentan a un ritmo considerable; la aplicación combinada de tecnología y software, junto con algoritmos avanzados y diferentes métodos para recopilar, procesar y analizar datos se ha vuelto fundamental para obtener la información necesaria para una eficiente toma de decisiones. Es dentro de este contexto, que se viene produciendo un gran crecimento en la utilización de Python dentro de la industria de las finanzas.

Python se esta comenzando a utilizar ampliamente en diversos sectores de las finanzas, como la banca, la gestión de inversiones, los seguros, e incluso en los bienes raíces; se utiliza principalmente para la construcción de herramientas que ayuden en la creación de modelos financieros, gestión de riesgos, y el comercio. Incluso las grandes corporaciones financieras, como Bank of America o JP Morgan, estan comenzando a utilizar Python para construir su infraestructura para la gestión de posiciones financieras, precios de activos, gestión de riesgos, sistemas de comercio y comercio algoritmico.

Algunas de las razones que hacen de Python un lenguaje de programación tan atractivo en el mundo de las finanzas son:

  • Su simple sintaxis: Python es mundialmente conocido por lo fácil que resulta leerlo, muchas veces no existen casi diferencias entre seudo código y Python; tampoco suelen existir muchas diferencias entre expresar un algoritmo matematicamente o en Python.
  • Su ecosistema: Python es mucho más que un lenguaje de programación, es todo un ecosistema en sí mismo; ya que podemos encontrar un sinnúmero de herramientas para realizar cualquier tipo de tareas; en Python podemos encontrar módulos para realizar cálculos científicos, módulos para desarrollar aplicaciones webs, módulos para realizar tareas de administración de sistemas, módulos para trabajar con bases de datos; entre otros. Todos ellos muy fácilmente integrables dentro del lenguaje. La variedad del ecosistema de herramientas de Python, nos ofrece la posibilidad de desarrollar una solución completa a cualquier tipo de problema utilizando un solo lenguaje de programación.
  • Su integración: Otras de las características por la que Python es también famoso, es por su fácil integración con otros lenguajes de programación. Generalmente, las grandes empresas suelen tener herramientas desarrolladas en distintos lenguajes de programación; las características dinámicas de Python, hacen que sea ideal para unir todos esos distintos componentes en una sola gran aplicación. Python puede ser enlazado fácilmente a herramientas desarrollas en C, C++ o Fortran.
  • Eficiencia y productividad: Por último, otra de las características que hacen a Python tan atractivo, es que con él, se pueden lograr resultados de calidad en una forma mucho más eficiente y productiva. La mayoría de sus módulos están ampliamente testeados y cuentan con el soporte de una amplia comunidad de usuarios; sus características dinámicas e interactivas lo hacen ideal para el análisis exploratorio de datos facilitando los análisis financieros. También es sabido, que la elegancia de su sintaxis hace que se necesiten mucho menos líneas de código para desarrollar un programa en Python que en casi cualquier otro lenguaje de programación.

Principales librerías

Las principales librerías que vamos a utilizar para realizar tareas de analisis financiero con Python son muchas de las que ya he venido hablando en anteriores artículos; principalmente:

  • Pandas: La cual fue diseñada desde un comienzo para facilitar el análisis de datos financieros, principalmente las series de tiempo propias del mercado cambiario de acciones. Con las estructuras de datos que nos brinda esta librería se vuelve sumamente fácil modelar y resolver problemas financieros.

  • Numpy: El principal modulo matemático que nos ofrece Python, en el no solo vamos a encontrar las siempre prácticas matrices que facilitan en sobremanera el manejo de información numérica; sino que también vamos a poder encontrar un gran número de funciones matemáticas.

  • Matplotlib: La siempre vigente librería para realizar gráficos en Python.

  • statsmodels: Si de estadística se trata, no hay como esta librería para realizar cualquier tipo de analisis estadístico.

  • PuLP: La cual nos permite crear modelos de programación lineal en forma muy sencilla.

  • Quandl: Este módulo nos permite interactuar fácilmente con la API de quandl.com para obtener en forma muy sencilla todo tipo de información financiera.

  • Zipline: Zipline es una librería para el comercio algoritmico; esta basada en eventos y trata de aproximarse lo más cerca posible a como operan los verdades sistemas de comercio electrónico de las principales bolsas del mundo. Zipline es una de las principales tecnologías detrás del popular sitio quantopian.com, la comunidad web que pone a prueba distintos algoritmos de comercio algoritmico.

Bueno, pero basta de introducciones y pasamos a describir los principales conceptos financieros y como podemos calcularlos con la ayuda de Python, ya que el tiempo es dinero!!.

Conceptos básicos de Finanzas

Los conceptos más básicos que podemos encontrar dentro de las finanzas son: valor futuro, valor presente, y la tasa interna de retorno. Estos conceptos nos dicen cuanto nuestro dinero va a crecer si lo depositamos en un banco (valor futuro), cuanto vale hoy la promesa de unos pagos que recibiremos en el futuro(valor presente), y qué tasa de rendimiento podemos obtener de nuestras inversiones (tasa interna de retorno). Recordemos que todos los activos financieros y toda planificación financiera siempre tiene una dimensión de tiempo; así por ejemplo si depositamos USD 100 en un banco que nos paga una tasa de interés anual de 6% , luego de un año obtendríamos un importe de USD 106.

Valor Futuro

El valor futuro o FV (por sus siglas en inglés), nos indica el valor en el futuro que tendrá el dinero depositado hoy en una cuenta bancaria que nos pague intereses. El valor futuro de USD X depositado hoy en una cuenta que paga r% de interés anual y que es dejado en la cuenta durante n años es $X * (1 + r)^n$. El valor futuro es nuestro primer ejemplo de interés compuesto, es decir, el principio de que podemos ganar intereses sobre los intereses. De la definición que dimos del valor futuro, podemos obtener su expresión matemática:

$$FV = X * ( 1 + r )^n$$

Como podemos ver, su cálculo es bastante simple. Veamos un ejemplo de como calcular el FV de un depósito de USD 1000 a 3 años y con una tasa de interés del 6% anual.

In [1]:
# graficos embebidos
%matplotlib inline  
In [2]:
# Ejemplo FV con python
# $1000 al 6% anual por 3 años.

# importando librerías
import numpy as np
import matplotlib.pyplot as plt

x = -1000  # deposito
r = .06    # tasa de interes
n = 3      # cantidad de años

# usando la funcion fv de numpy
FV = np.fv(pv=x, rate=r, nper=n, pmt=0)
FV
Out[2]:
1191.0160000000001
In [3]:
# Controlando el resultado
x * (1 + r)**n
Out[3]:
-1191.016
In [4]:
# Graficando las funciones con interes de 6 y 12 % a 20 años.
t = list(range(0, 21))

def fv6(num):
    return np.fv(pv=-1000, rate=r, pmt=0, nper=num)

def fv12(num):
    return np.fv(pv=-1000, rate=.12, pmt=0, nper=num)
In [5]:
plt.title("Graficando FV 6 y 12 %")
plt.plot(t, fv6(t), label="interes 6 %")
plt.plot(t, fv12(t), label="interes 12 %")
plt.legend(loc='upper left')
plt.show()

Al graficar dos funciones de FV, una con una tasa de interes del 6% y otra con una tasa más alta del 12%, podemos ver que el valor futuro suele ser bastante sensitivo a los cambios en la tasa de interes, pequeñas variaciones en ella pueden generar grandes saltos a lo largo del tiempo.

Anualidades

Como podemos ver en el ejemplo anterior, la función fv de Numpy tiene varios parámetros, esto es así, porque existen otros casos en los que el cálculo del valor futuro se puede volver más complicado; es aquí cuando comenzamos a hablar de anulidades. La idea de las anualidades es no solo quedarse con el cálculo simple de cuanto me va a rendir un solo deposito inicial a fin de un período, sino también poder calcular el valor futuro de múltiples depósitos que se reinvierten a una misma tasa de interés. Supongamos por ejemplo que queremos hacer 10 depósitos anuales de USD 1000 cada uno, los cuales vamos a ir depositando al comienzo de cada año. ¿Cuál sería en este caso el valor futuro de nuestra anualidad luego del décimo año?. Ayudémonos de Python para calcular la respuesta!

In [6]:
# Calculando el valor de la anualidad con 6% anual
x = -1000 # valor de depositos
r = .06   # tasa de interes
n = 10    # cantidad de años

# usando la funcion fv de numpy
FV = np.fv(pv=0, rate=r, nper=n, pmt=x, when='begin')
FV
Out[6]:
13971.642638923764

Aquí comenzamos con un valor presente(PV) de cero, luego realizamos el primer deposito de USD 1000 al comienzo del primer año y continuamos con los sucesivos depósitos al comienzo de cada uno de los restantes años. Para poder entender mejor como funciona la función fv de Numpy voy a explicar un poco más sus parámetros.

  • pv = este parametro es el valor presente de nuestra inversión o anualidad; en nuestro ejemplo empezamos con un valor de cero; ya que luego vamos a ir realizando los diferentes depósitos de USD 1000.
  • rate = es la tasa efectiva de interés que nos rendirá la anualidad por cada período.
  • nper = Es el número de períodos. Tener en cuenta que si aquí estamos utilizando como unidad de medida de años, nuestra tasa de interés deberá estar expresada en la misma unidad.
  • pmt = El valor de los depósitos que vamos a ir invirtiendo en nuestra anualidad. En nuestro caso el valor de -1000 refleja el importe que vamos a ir depositando año a año.(se expresa con signo negativo, ya que un deposito implica una salida de dinero).
  • when = Este parámetro nos dice cuando se van a hacer efectivos nuestros depósitos, ya que el resultado puede ser muy distinto si realizamos el deposito al comienzo(como en nuestro ejemplo) o al final de cada período.
In [7]:
# mismo caso pero con la diferencia de que los depositos se 
# realizan al final de cada período.
FV = np.fv(pv=0, rate=r, nper=n, pmt=x, when='end')
FV
Out[7]:
13180.79494238091

En este último ejemplo, el valor es menor por las perdidas relativas de interés que vamos teniendo al realizar los depósitos al final de cada período en lugar de al comienzo.

Valor Presente

El valor presente o PV (por sus siglas en inglés), nos indica el valor que tienen hoy un pago o pagos que recibiremos en el futuro. Supongamos por ejemplo que sabemos que un tío nos va a regalar USD 1000 dentro de 3 años porque somos su sobrino favorito, si también sabemos que un banco nos pagaría un 6% de interés por los depósitos en una caja de ahorro, podríamos calcular el valor presente que tendría ese pago futuro de nuestro tío en el día de hoy. La formula para calcular el valor presente la podemos derivar de la que utilizamos para calcular el valor futuro y se expresaría del siguiente modo:

$$PV =\frac{fv}{(1 + r)^n}$$

Aplicando la esta formula sobre los datos con que contamos, podríamos calcular el valor de hoy de la promesa de pago de USD 1000 de nuestro tío, los que nos daría un valor presente de USD 839.62 como se desprende del siguiente cálculo.

In [8]:
fv = 1000  # valor futuro
r = .06   # tasa de interes
n = 3     # cantidad de años

fv / ((1 + r)**n)
Out[8]:
839.6192830323018
In [9]:
# usando la funcion pv de numpy
PV = np.pv(fv=fv, rate=r, nper=n, pmt=0)
PV
Out[9]:
-839.61928303230184

Estos USD 839.62 en realidad lo que representan es que si nosotros hoy depositáramos en la caja de ahorro de un banco que nos pague 6% anual de interés el importe de USD 839.62, obtendríamos dentro de los 3 años los mismos USD 1000 que nos ofreció dar nuestro tío dentro de 3 años; o lo que es lo mismo que decir que el valor futuro dentro de 3 años de USD 839.62 son los USD 1000 de nuestro querido tío.

In [10]:
# Calculando el valor futuro de los 839.62
np.fv(pv=-839.62, rate=r, nper=n, pmt=0)
Out[10]:
1000.0008539200001

Valor presente y anualidades

Al igual que en el caso del valor futuro, aquí también podemos encontrarnos con las anualidades, es decir, una serie de pagos iguales que recibiremos. El valor presente de una anualidad nos va a decir el valor que tienen hoy los futuros pagos de la anualidad. Así, por ejemplo si nuestro tío en lugar de regalarnos USD 1000 dentro de 3 años, decide darnos USD 250 al final de cada año durante 5 años; y asumiendo la misma tasa de interés que nos ofrece el banco de 6% anual. El valor presente de esta anualidad sería USD 1053.09.

In [11]:
# Calculando el valor de la anualidad
PV = np.pv(fv=0, rate=r, nper=5, pmt=-250, when='end')
PV
Out[11]:
1053.090946391429

Eligiendo la tasa de descuento

Uno de los puntos sobre el que hacer más foco al calcular el valor presente de un flujo de fondos futuro, es el de como elegir la tasa para descontar estos fondos, ya que la tasa que utilicemos es la pieza clave para la exactitud de nuestros cálculos. El principio básico que nos debe guiar la elegir la tasa de descuento es el de tratar de elegir que sea apropiada al riesgo y la duración de los flujos de fondos que estamos descontando. En el ejemplo que venimos viendo, como sabemos que nuestro tío es una persona muy solvente y de palabra, podemos considerar que no existe mucho riesgo en ese flujo de fondos, por lo que utilizar la tasa de interés de una caja de ahorro parece ser un buen criterio para descontar ese flujo. En los casos de las empresas, las mismas suelen utilizar el costo del capital como una tasa de descuento apropiada para descontar el flujo futuro de sus inversiones o proyectos.

Valor Presente Neto

Un concepto que merece una especial mención, por su importancia dentro del mundo de las finanzas, cuando hablamos del valor presente, es el de Valor Presente Neto. Cuando estamos descontando flujos de fondos futuros para traerlos a su valor actual, puede ser que éstos flujos no sean homogeneos, por lo que ya no podríamos tratarlos como una anualidad, ya que los pagos son por importes distintos todos los años; para estos casos debemos utilizar el Valor Presente Neto.

El Valor Presente Neto o NPV (por sus siglas en inglés) de una serie de flujos futuros de fondos es su igual a su valor presente menos el importe de la inversión inicial necesaria para obtener esos mismos flujos de fondos futuros. Su expresión matemática sería la siguiente:

$$NPV = \sum\limits_{t=1}^n \frac{V_{t}}{(1 + r)^t} - I_{0}$$

donde, $V_{t}$ representa el flujo de fondos de cada período $t$; $I_{0}$ es el valor inicial de la inversión; $r$ es la tasa de descuento utilizada; y $n$ es la cantidad de períodos considerados.

Volviendo al ejemplo que veníamos utilizando de nuestro generoso tío, esta vez no ofrece pagarnos USD 500 al final del primer año, USD 750 al final del segundo año, USD 1000 al final del tercer año, USD 1250 al final del cuarto año y USD 500 al final del quinto año. El NPV de este flujo de fondos sería de USD 3342.56.

In [12]:
# Calculando el valor presente neto.
NPV = np.npv(rate=.06, values=[0, 500, 750, 1000, 1250, 500])
NPV
Out[12]:
3342.5608917310828

El Valor Presente Neto es sumamente utilizado en los análisis financieros, principalmente para evaluar inversiones o proyectos. Como regla general se considera que si el NPV de un proyecto o inversión es positivo, se trata de un proyecto rentable en el que deberíamos invertir; en cambio si el NPV es negativo estamos ante un mal negocio.

Si por ejemplo, tendríamos que invertir hoy USD 4000 para poder obtener un flujo de fondos de USD 500 al final del primer año, USD 750 al final del segundo año, USD 1000 al final del tercer año, USD 1250 al final del cuarto año y USD 500 al final del quinto año; estaríamos haciendo un mal negocio, ya que como sabemos el valor presente de esos flujos de fondos es de USD 3342.56, un valor mucho menor a los USD 4000 que deberíamos invertir.

In [13]:
# Calculando el NPV de la inversión de 4000.
NPV = np.npv(rate=.06, values=[-4000, 500, 750, 1000, 1250, 500])
NPV
Out[13]:
-657.43910826891715

En el ejemplo podemos ver que al utilizar la función npv de Numpy, el primer valor en la lista de valores que le pasamos al parámetro values debe ser el monto de la inversión inicial, y como implica un desembolso de dinero, su signo es negativo.

Si en lugar de tener que invertir USD 4000, tendríamos que invertir USD 3000 para obtener el mismo flujo de fondos, ya estaríamos realizando una buena inversión, con NPV positivo.

In [14]:
# Calculando el NPV de la inversión de 3000.
NPV = np.npv(rate=.06, values=[-3000, 500, 750, 1000, 1250, 500])
NPV
Out[14]:
342.56089173108285

Tasa interna de Retorno

La tasa interna de retorno o IRR (por sus siglas en inglés) es la tasa de descuento que hace que el Valor Presente Neto de los flujos de fondos futuros sea igual a cero; también puede ser definida como la tasa de interés compuesto que nos paga nuestra inversión.

Al igual que como sucede con el Valor Presente Neto, podemos utilizar a la tasa interna de retorno para tomar decisiones financieras. Aquí la regla general es que, al momento de decidir entre diferentes inversiones, deberíamos elegir aquella con una tasa interna de retorno más alta; ya que es la que en menos tiempo no va a devolver nuestra inversión inicial.

Veamos un ejemplo, supongamos que tenemos USD 1000 para invertir, y que podemos decidir invertir ese dinero en una compañía que nos va a pagar USD 300 al final de cada uno de los próximos cuatro años; o por otra lado, podemos invertir el dinero en una caja de ahorro de un banco que nos va a pagar 5% anual. ¿Dónde deberíamos invertir nuestro dinero?

In [15]:
# Calculando la tasa interna de retorno de la inversion en la compañía
IRR = np.irr([-1000, 300, 300, 300, 300])
IRR * 100
Out[15]:
7.713847295208343

Al calcular la IRR de la inversión que podríamos hacer en la compañía, vemos que nos da un valor de 7.71%; esta tasa es más alta que la tasa del 5% que nos ofrece el banco por el deposito en su caja de ahorro, por lo que deberíamos decidir invertir nuestro dinero en la compañía en lugar de en el banco.

La IRR graficamente

Como se desprende de su definición, la tasa interna de retorno es la tasa que hace que el NPV se haga cero, por lo que si nos propusiesemos graficar el NPV en función de la tasa de descuento, podríamos encontrar a simple vista, cual es la IRR de un determinado flujo de fondos. Veamos un ejemplo, graficando el flujo de fondos con el que trabajamos anteriormente.

In [16]:
# Graficando el NPV en función de la tasa de descuento
def npv_irr(tasas):
    result = []
    for tasa in tasas:
        result.append(np.npv(tasa/100,[-1000, 300, 300, 300, 300] ))
    return result

tasas = list(range(14))

plt.title("NPV y la tasa de descuento")
plt.plot(tasas, npv_irr(tasas), marker='o', label='NPV')
plt.axhline(0, color='red')
axes = plt.gca()
axes.set_ylim([-200,250])
plt.xticks(tasas)
plt.legend(loc='upper right')
plt.show()

Como podemos ver en el gráfico, la función de NPV, se hace cero en aproximadamente 7.71%; es decir, el valor de la IRR para ese flujo de fondos.

Información financiera y Pandas

En las finanzas, una de las formas de datos más comunes e importantes con la que nos vamos a encontrar son las series de tiempo; para trabajar con este tipo de información en Python, no existe mejor librería que Pandas; sus dos estructuras de datos básicas, las Series y el Dataframe, nos ayudan a manipular información financiera de forma muy conveniente. Además Pandas nos proporciona una gran batería de métodos y funciones que nos facilitan la obtención y el análisis de datos financieros. Veamos algunos ejemplos de las cosas que podemos con Pandas.

In [17]:
# Importando pandas y datetime
import pandas as pd
import pandas.io.data as web
import datetime as dt

# Extrayendo información financiera de Yahoo! Finance
inicio = dt.datetime(2014, 1, 1)
fin = dt.datetime(2014, 12, 31)

msft = web.DataReader("MSFT", 'yahoo', inicio, fin)  # información de Microsoft
aapl = web.DataReader("AAPL", 'yahoo', inicio, fin)  # información de Apple
In [18]:
msft[:3]
Out[18]:
Open High Low Close Volume Adj Close
Date
2014-01-02 37.349998 37.400002 37.099998 37.160000 30632200 35.448341
2014-01-03 37.200001 37.220001 36.599998 36.910000 31134800 35.209856
2014-01-06 36.849998 36.889999 36.110001 36.130001 43603700 34.465786
In [19]:
aapl[:3]
Out[19]:
Open High Low Close Volume Adj Close
Date
2014-01-02 555.680008 557.029945 552.020004 553.129990 58671200 76.419139
2014-01-03 552.860023 553.699989 540.430046 540.980019 98116900 74.740527
2014-01-06 537.450005 546.800018 533.599983 543.930046 103152700 75.148096
In [20]:
# Seleccionando solo el Adj Close price de Enero 2014
msft01 = msft['2014-01'][['Adj Close']]
aapl01 = aapl['2014-01'][['Adj Close']]

msft01[:3]
Out[20]:
Adj Close
Date
2014-01-02 35.448341
2014-01-03 35.209856
2014-01-06 34.465786
In [21]:
aapl01.head()  # head() nos muestra los primeros 5 registros
Out[21]:
Adj Close
Date
2014-01-02 76.419139
2014-01-03 74.740527
2014-01-06 75.148096
2014-01-07 74.610653
2014-01-08 75.083151
In [22]:
# tambien se puede seleccionar un rango de tiempo
msft['2014-02':'2014-02-13']  # desde el 1 al 13 de febrero
Out[22]:
Open High Low Close Volume Adj Close
Date
2014-02-03 37.740002 37.990002 36.430000 36.480000 64063100 34.799662
2014-02-04 36.970001 37.189999 36.250000 36.349998 54697900 34.675649
2014-02-05 36.290001 36.470001 35.799999 35.820000 55814400 34.170063
2014-02-06 35.799999 36.250000 35.689999 36.180000 35351800 34.513482
2014-02-07 36.320000 36.590000 36.009998 36.560001 33260500 34.875979
2014-02-10 36.630001 36.799999 36.290001 36.799999 26767000 35.104922
2014-02-11 36.880001 37.259998 36.860001 37.169998 32141400 35.457878
2014-02-12 37.349998 37.599998 37.299999 37.470001 27051800 35.744063
2014-02-13 37.330002 37.860001 37.330002 37.610001 37635500 35.877614
In [23]:
# combinando ambos resultados
close = pd.concat([msft01, aapl01], keys=['MSFT', 'AAPL'])
close[:5]
Out[23]:
Adj Close
Date
MSFT 2014-01-02 35.448341
2014-01-03 35.209856
2014-01-06 34.465786
2014-01-07 34.732887
2014-01-08 34.112826
In [24]:
# seleccionando los primeros 5 registros de AAPL
close.ix['AAPL'][:5]  
Out[24]:
Adj Close
Date
2014-01-02 76.419139
2014-01-03 74.740527
2014-01-06 75.148096
2014-01-07 74.610653
2014-01-08 75.083151
In [25]:
# insertando una nueva columna con el simbolo
msft.insert(0, 'Symbol', 'MSFT')
aapl.insert(0, 'Symbol', 'AAPL')

msft.head()
Out[25]:
Symbol Open High Low Close Volume Adj Close
Date
2014-01-02 MSFT 37.349998 37.400002 37.099998 37.160000 30632200 35.448341
2014-01-03 MSFT 37.200001 37.220001 36.599998 36.910000 31134800 35.209856
2014-01-06 MSFT 36.849998 36.889999 36.110001 36.130001 43603700 34.465786
2014-01-07 MSFT 36.330002 36.490002 36.209999 36.410000 35802800 34.732887
2014-01-08 MSFT 36.000000 36.139999 35.580002 35.759998 59971700 34.112826
In [26]:
# concatenando toda la información y reseteando el indice
combinado = pd.concat([msft, aapl]).sort_index()
datos_todo = combinado.reset_index()

datos_todo.head()
Out[26]:
Date Symbol Open High Low Close Volume Adj Close
0 2014-01-02 MSFT 37.349998 37.400002 37.099998 37.160000 30632200 35.448341
1 2014-01-02 AAPL 555.680008 557.029945 552.020004 553.129990 58671200 76.419139
2 2014-01-03 MSFT 37.200001 37.220001 36.599998 36.910000 31134800 35.209856
3 2014-01-03 AAPL 552.860023 553.699989 540.430046 540.980019 98116900 74.740527
4 2014-01-06 MSFT 36.849998 36.889999 36.110001 36.130001 43603700 34.465786
In [27]:
# Armando una tabla pivot del precio de cierre
pivot = datos_todo.pivot(index='Date', columns='Symbol', 
                         values='Adj Close')

pivot.head()
Out[27]:
Symbol AAPL MSFT
Date
2014-01-02 76.419139 35.448341
2014-01-03 74.740527 35.209856
2014-01-06 75.148096 34.465786
2014-01-07 74.610653 34.732887
2014-01-08 75.083151 34.112826
In [28]:
# Obteniendo datos de multiples empresas
def all_stocks(symbols, start, end):
       def data(symbols):
           return pd.io.data.DataReader(symbols, 'yahoo', start, end)
       datas = map(data, symbols)
       return pd.concat(datas, keys=symbols, names=['symbols','Date'])

simbolos = ['AAPL','MSFT','GOOG','IBM']

all_data = all_stocks(simbolos, inicio, fin)
all_data.head()
Out[28]:
Open High Low Close Volume Adj Close
symbols Date
AAPL 2014-01-02 555.680008 557.029945 552.020004 553.129990 58671200 76.419139
2014-01-03 552.860023 553.699989 540.430046 540.980019 98116900 74.740527
2014-01-06 537.450005 546.800018 533.599983 543.930046 103152700 75.148096
2014-01-07 544.320015 545.960052 537.919975 540.039970 79302300 74.610653
2014-01-08 538.810036 545.559990 538.689980 543.459969 64632400 75.083151
In [29]:
all_data.ix['GOOG'].head()  # información de google
Out[29]:
Open High Low Close Volume Adj Close
Date
2014-03-27 568.002570 568.002570 552.922516 558.462551 13100 558.462551
2014-03-28 561.202549 566.432590 558.672477 559.992504 41200 559.992504
2014-03-31 566.892592 567.002574 556.932537 556.972503 10800 556.972503
2014-04-01 558.712565 568.452595 558.712565 567.162558 7900 567.162558
2014-04-02 599.992707 604.832763 562.192568 567.002574 147100 567.002574
In [30]:
# Graficando los datos.
solo_cierre = all_data[['Adj Close']].reset_index()
pivot_cierre = solo_cierre.pivot('Date', 'symbols', 'Adj Close')

pivot_cierre.head()
Out[30]:
symbols AAPL GOOG IBM MSFT
Date
2014-01-02 76.419139 NaN 177.049572 35.448341
2014-01-03 74.740527 NaN 178.108836 35.209856
2014-01-06 75.148096 NaN 177.498090 34.465786
2014-01-07 74.610653 NaN 181.038515 34.732887
2014-01-08 75.083151 NaN 179.378044 34.112826
In [31]:
# Graficando la información de Apple
pivot_cierre['AAPL'].plot(figsize=(12,8))  
Out[31]:
<matplotlib.axes._subplots.AxesSubplot at 0x7f5445826080>
In [32]:
# Graficando todos
pivot_cierre.plot(figsize=(12,8)) 
Out[32]:
<matplotlib.axes._subplots.AxesSubplot at 0x7f54457194e0>

Como podemos ver Pandas es una librería muy versátil, con ella podemos hacer todo tipo de manipulaciones de datos, desde obtener los datos desde la web hasta realizar concatenaciones, tablas pivot o incluso realizar gráficos.

Con esto termino esta introducción a finanzas con Python; los dejo para que se entretengan con sus propios ejemplos, a practicar!

Saludos!

Este post fue escrito utilizando IPython notebook. Pueden descargar este notebook o ver su version estática en nbviewer.

Comments