aby przeprowadzić analizę, musisz najpierw ocenić dwa poniższe pytania.
- jakich danych potrzebujesz?
- Jak można uzyskać do niego dostęp?
odpowiedź na te pytania jest krytyczna, ale nie zawsze prosta. Oczywiście wyszukiwanie Google może prowadzić do wyników, ale pomocne może być również poproszenie rówieśników o poradę. Poświęć trochę czasu na te pytania, dopóki nie będziesz pewien, że znalazłeś właściwą odpowiedź.,
w jednym z moich projektów potrzebowałem dostępu do danych finansowych niemieckich firm, aby przeanalizować wpływ nowego obowiązkowego standardu rachunkowości na spready bid-ask.
Można by pomyśleć, że po prostu Korzystanie z tej bazy danych byłoby wystarczające i że mogę w końcu wykonać prawdziwą pracę.
False! Zbierając dane dla tych firm, skończyłem z 8 różnymi arkuszami Excela, które musiałem jakoś połączyć w jedną ramkę danych.,
Datastream dostarczył mi statycznych informacji o firmie, które mogłyby skończyć jako mój główny arkusz.
inne arkusze Excela, które otrzymałem, miały następujący format, ponieważ uzyskiwałem dostęp do danych szeregów czasowych dla każdej firmy.
W Jaki Sposób Mogę uzyskać takie dane w sensownym formacie, aby móc ich używać wraz z innymi informacjami o firmie?
wykonajmy jedną z moich kalkulacji, abyś zrozumiał., Miałem dwa arkusze-jeden dla cen bid i jeden dla cen ask. Potrzebowałem średniego względnego spreadu bid-ask.
najpierw załadowałem Dane i kontrolowałem brakujące wartości. Zauważyłem jeden wiersz, który był całkowicie brakujący i usunąłem go dla obu zestawów danych.
następnie obliczyłem spread bid-ask, odejmując cenę bid od ceny ask.
następnie musiałem obliczyć względny spread bid-ask., Dlatego musiałem importować dzienne ceny akcji, skreślić 149 wiersz i obliczyć spready bid-ask w stosunku do ceny.
w końcu obliczyłem średnią względnych spreadów bid-ask i połączyłem je ze statyczną ramką danych.
To jest tylko kod dla jednej dodatkowej zmiennej! Wyobraź sobie, że robisz to dla 20 lub nawet 30 innych zmiennych, których nie możesz wyjąć z pudełka ze strumienia danych. Trwa to znacznie dłużej niż 5 minut.,
istnieje wiele innych możliwych metod tworzenia własnego zestawu danych od podstaw. Możesz na przykład przeprowadzić starą dobrą ankietę lub zeskrobać tweety z Twittera. Ostatecznie zależy to od tego, jakiego rodzaju danych potrzebujesz.
ok, czas na szybką ocenę.
zalety:
- funkcje są uwzględniane w zależności od celu pytania lub zadania badawczego. Nie odwrotnie. Pomaga to wykorzystywać tylko znaczące dane.
- możliwe jest śledzenie sposobu tworzenia zmiennych.