jak zbierać dane do analizy

aby przeprowadzić analizę, musisz najpierw ocenić dwa poniższe pytania.

  • jakich danych potrzebujesz?
  • Jak można uzyskać do niego dostęp?

odpowiedź na te pytania jest krytyczna, ale nie zawsze prosta. Oczywiście wyszukiwanie Google może prowadzić do wyników, ale pomocne może być również poproszenie rówieśników o poradę. Poświęć trochę czasu na te pytania, dopóki nie będziesz pewien, że znalazłeś właściwą odpowiedź.,

w jednym z moich projektów potrzebowałem dostępu do danych finansowych niemieckich firm, aby przeanalizować wpływ nowego obowiązkowego standardu rachunkowości na spready bid-ask.

Można by pomyśleć, że po prostu Korzystanie z tej bazy danych byłoby wystarczające i że mogę w końcu wykonać prawdziwą pracę.

False! Zbierając dane dla tych firm, skończyłem z 8 różnymi arkuszami Excela, które musiałem jakoś połączyć w jedną ramkę danych.,

Datastream dostarczył mi statycznych informacji o firmie, które mogłyby skończyć jako mój główny arkusz.

inne arkusze Excela, które otrzymałem, miały następujący format, ponieważ uzyskiwałem dostęp do danych szeregów czasowych dla każdej firmy.

W Jaki Sposób Mogę uzyskać takie dane w sensownym formacie, aby móc ich używać wraz z innymi informacjami o firmie?

wykonajmy jedną z moich kalkulacji, abyś zrozumiał., Miałem dwa arkusze-jeden dla cen bid i jeden dla cen ask. Potrzebowałem średniego względnego spreadu bid-ask.

najpierw załadowałem Dane i kontrolowałem brakujące wartości. Zauważyłem jeden wiersz, który był całkowicie brakujący i usunąłem go dla obu zestawów danych.

następnie obliczyłem spread bid-ask, odejmując cenę bid od ceny ask.

następnie musiałem obliczyć względny spread bid-ask., Dlatego musiałem importować dzienne ceny akcji, skreślić 149 wiersz i obliczyć spready bid-ask w stosunku do ceny.

w końcu obliczyłem średnią względnych spreadów bid-ask i połączyłem je ze statyczną ramką danych.

To jest tylko kod dla jednej dodatkowej zmiennej! Wyobraź sobie, że robisz to dla 20 lub nawet 30 innych zmiennych, których nie możesz wyjąć z pudełka ze strumienia danych. Trwa to znacznie dłużej niż 5 minut.,

istnieje wiele innych możliwych metod tworzenia własnego zestawu danych od podstaw. Możesz na przykład przeprowadzić starą dobrą ankietę lub zeskrobać tweety z Twittera. Ostatecznie zależy to od tego, jakiego rodzaju danych potrzebujesz.

ok, czas na szybką ocenę.

zalety:

  • funkcje są uwzględniane w zależności od celu pytania lub zadania badawczego. Nie odwrotnie. Pomaga to wykorzystywać tylko znaczące dane.
  • możliwe jest śledzenie sposobu tworzenia zmiennych.

Leave a Comment