tout d’Abord, vous devez évaluer les deux questions suivantes pour effectuer votre analyse.
- Quel type de données avez-vous besoin?
- Comment pouvez-vous y accéder?
répondre à ces questions est essentiel mais pas toujours simple. Bien sûr, une recherche Google pourrait conduire à des résultats, mais demander des conseils à des pairs pourrait également être utile. Passez du temps avec ces questions jusqu’à ce que vous soyez sûr d’avoir trouvé la bonne réponse.,
dans l’un de mes projets, j’avais besoin d’accéder aux données financières des entreprises allemandes pour analyser l’effet d’une nouvelle norme comptable obligatoire sur les spreads bid-ask.
heureusement, mon professeur nous a fourni un compte Thomson Reuters, et J’ai pu utiliser Datastream pour accéder aux données financières de ces entreprises. On pourrait penser que simplement utiliser cette base de données serait suffisant et que je pourrais enfin faire le vrai travail.
faux! Lors de la collecte des données pour ces entreprises, je me suis retrouvé avec 8 feuilles excel différentes que j’ai dû fusionner en une seule trame de données.,
Datastream m’a fourni des informations statiques sur l’entreprise qui finiraient par être ma feuille principale.
Les autres feuilles de calcul excel que j’ai eu a le format suivant parce que j’étais accéder aux données de séries chronologiques pour chaque entreprise.
Alors, comment puis-je obtenir de telles données dans un format explicite pour que je puisse l’utiliser avec les autres informations de la société?
effectuons un de mes calculs pour que vous ayez l’idée., J’avais deux feuilles-une pour les prix bid et une pour les prix ask. Ce dont j’avais besoin, c’était de la moyenne relative bid-ask spread.
Tout d’abord, j’ai chargé les données et contrôlé les valeurs manquantes. J’ai repéré une ligne qui manquait complètement et l’ai supprimée pour les deux ensembles de données.
Ensuite, j’ai calculé l’écart acheteur-vendeur en soustrayant le prix de l’offre à partir du prix de la demande.
j’ai eu Ensuite pour calculer la relative écart acheteur-vendeur., Par conséquent, j’ai dû importer les cours quotidiens des actions, supprimer la 149e ligne et calculer les écarts acheteur-vendeur par rapport au prix.
Enfin, j’ai calculé la moyenne de la relative écarts acheteur-vendeur et l’a fusionné dans la statique de la trame de données.
Ce n’est que le code que pour une variable supplémentaire! Imaginez faire cela pour 20 ou même 30 autres variables que vous ne pouvez pas sortir de la boîte à partir de Datastream. Cela prend beaucoup plus de 5 minutes.,
Il existe de nombreuses autres méthodes réalisables pour créer votre propre ensemble de données à partir de zéro. Vous pouvez, par exemple, mener une bonne vieille enquête ou gratter des tweets de Twitter. En fin de compte, cela dépend du type de données dont vous avez besoin.
d’Accord, il est temps pour une évaluation rapide.
avantages:
- Les caractéristiques sont incluses en fonction de l’objectif de la question ou de la tâche de recherche. Pas vice-versa. Cela permet d’utiliser uniquement des données significatives.
- Il est traçable comment les variables ont été créées.
Inconvénients: