Zunächst müssen Sie die folgenden zwei Fragen bewerten, um Ihre Analyse durchzuführen.
- Welche Art von Daten benötigen Sie?
- Wie können Sie darauf zugreifen?
Die Beantwortung dieser Fragen ist kritisch, aber nicht immer unkompliziert. Natürlich kann eine Google-Suche zu Ergebnissen führen, aber es kann auch hilfreich sein, Gleichaltrige um Rat zu fragen. Verbringen Sie einige Zeit mit diesen Fragen, bis Sie sicher sind, dass Sie die richtige Antwort gefunden haben.,
In einem meiner Projekte musste ich auf Finanzdaten deutscher Unternehmen zugreifen, um die Auswirkungen eines neuen obligatorischen Rechnungslegungsstandards auf Bid-Ask-Spreads zu analysieren.
Glücklicherweise hat uns mein Professor ein Thomson Reuters Konto zur Verfügung gestellt, und ich konnte Datastream verwenden, um auf die Finanzdaten dieser Unternehmen zuzugreifen. Sie würden denken, dass die einfache Verwendung dieser Datenbank ausreichen würde und dass ich endlich die eigentliche Arbeit erledigen könnte.
Falsch! Beim Sammeln der Daten für diese Unternehmen hatte ich 8 verschiedene Excel-Tabellen, die ich irgendwie zu einem Datenrahmen zusammenführen musste.,
Datastream lieferte mir einige statische Unternehmensinformationen, die als mein Hauptblatt enden würden.
Die anderen Excel-Tabellen, die ich bekam, hatten das folgende Format, da ich für jedes Unternehmen auf Zeitreihendaten zugriff.
Wie kann ich solche Daten in ein aussagekräftiges Format bringen, damit ich sie zusammen mit den anderen Unternehmensinformationen verwenden kann?
Lassen Sie uns eine meiner Berechnungen durchführen, damit Sie auf die Idee kommen., Ich hatte zwei Blätter — eines für Angebotspreise und eines für Ask-Preise. Was ich brauchte, war die Durchschnittliche relative bid-ask-spread.
Zuerst habe ich die Daten geladen und nach fehlenden Werten gesucht. Ich habe eine Zeile entdeckt, die vollständig fehlte, und sie für beide Datensätze gelöscht.
Dann berechnete ich den Bid-Ask-Spread, indem ich den Bid-Preis vom Ask-Preis subtrahierte.
Dann musste ich zur Berechnung der relativen bid-ask-spread., Daher musste ich die täglichen Aktienkurse importieren, die 149.Zeile löschen und die Bid-Ask-Spreads relativ zum Preis berechnen.
Schließlich berechnete ich den Mittelwert der relativen Bid-Ask-Spreads und fügte sie in den statischen Datenrahmen ein.
Dies ist nur der Code für eine weitere Variable! Stellen Sie sich vor, Sie tun dies für 20 oder sogar 30 andere Variablen, die Sie aus dem Datenstrom nicht sofort abrufen können. Dies dauert viel länger als 5 Minuten.,
Es gibt viele andere mögliche Methoden, wie Sie Ihren eigenen Datensatz von Grund auf neu erstellen können. Sie könnten zum Beispiel eine gute alte Umfrage durchführen oder Tweets von Twitter kratzen. Letztendlich hängt es davon ab, welche Art von Daten Sie benötigen.
Okay, es ist Zeit für eine schnelle Beurteilung.
Vorteile:
- Merkmale werden basierend auf dem Zweck der Forschungsfrage oder-aufgabe enthalten. Nicht umgekehrt. Dies hilft, nur aussagekräftige Daten zu verwenden.
- Es ist nachvollziehbar, wie die Variablen erstellt wurden.
Nachteile: