cómo recopilar datos para su análisis

primero, debe evaluar las siguientes dos preguntas para realizar su análisis.

  • ¿Qué tipo de datos necesita?
  • ¿Cómo puedes acceder a él?

responder a estas preguntas es fundamental, pero no siempre es sencillo. Por supuesto, una búsqueda en Google podría llevar a resultados, pero pedir consejos a los compañeros también podría ser útil. Pase algún tiempo con estas preguntas hasta que esté seguro de que ha encontrado la respuesta correcta.,

en uno de mis proyectos, necesitaba acceder a datos financieros de empresas alemanas para analizar el efecto de un nuevo estándar de contabilidad obligatorio en los diferenciales bid-ask.

afortunadamente, mi profesor nos proporcionó una cuenta de Thomson Reuters, y pude usar Datastream para acceder a los datos financieros de estas compañías. Pensarías que simplemente usar esta base de datos sería suficiente y que finalmente podría hacer el trabajo real.

False! Al recopilar los datos para estas empresas, terminé con 8 hojas de excel diferentes que tuve que fusionar de alguna manera en un marco de datos.,

Datastream me proporcionó información estática de la empresa que terminaría como mi hoja principal.

las otras hojas de excel que obtuve tenían el siguiente formato porque estaba accediendo a datos de series temporales para cada empresa.

Así que ¿cómo puedo obtener esos datos en un formato significativo, de modo que yo pueda utilizar junto con la otra información de la empresa?

vamos a realizar uno de mis cálculos para que te hagas una idea., Tenía dos hojas, una para los precios de oferta y otra para los precios de demanda. Lo que necesitaba era el diferencial relativo promedio de oferta y demanda.

primero, cargué los datos y controlé los valores faltantes. Vi una fila que faltaba por completo y la eliminé para ambos conjuntos de datos.

a Continuación, he calculado el bid-ask restando el precio de la oferta del precio de venta.

Entonces, tuve que calcular la relación bid-ask., Por lo tanto, tuve que importar los precios diarios de las acciones, eliminar la fila 149 y calcular los diferenciales de oferta y demanda en relación con el precio.

por último, he calculado la media de la relación bid-ask spreads y se fusionaron en la estática del marco de datos.

Esto es sólo el código para una variable adicional! Imagine hacer eso para otras 20 o incluso 30 variables que no puede obtener de Datastream. Esto lleva más de 5 minutos.,

hay muchos otros métodos factibles de cómo puede crear su propio conjunto de datos desde cero. Podrías, por ejemplo, realizar una buena encuesta o extraer tweets de Twitter. En última instancia, depende del tipo de datos que necesite.

bien, es hora de una evaluación rápida.

ventajas:

  • Las características se incluyen en función del propósito de la pregunta o tarea de investigación. No al revés. Esto ayuda a utilizar solo datos significativos.
  • Se puede rastrear cómo se crearon las variables.

Desventajas:

Leave a Comment