관리 메뉴

오늘도 배운다

Forecasts for Product Demand (6) 데이터 조사 및 수집 본문

빅데이터(파이썬)/DA_Forecasts for Product Demand

Forecasts for Product Demand (6) 데이터 조사 및 수집

LearnerToRunner 2023. 1. 13. 21:59

Forecasts for Product Demand

데이터 조사 및 수집

데이터를 정제하기에 앞서 예측에 도움이 될 만한

데이터를 조사하고 수집하고자 함

 

 

수집할 데이터 1

공휴일

 

어느나라 공휴일 데이터를 모아야할까?

데이터셋의 출처에 관한 정보는 찾을 수 없다.
다만, Kaggle에 데이터셋을 올린 Felix Zhao는
중국인이며 그가 일하는 회사는 미국회사이다.

어느 국가인지 특정할 수 없으므로
중국, 미국 공휴일 데이터를 수집하였음

from holidays import country_holidays
import pandas as pd

class Holidays():
    def __init__(self, ls_years):
        self.ls_years = ls_years # list of dataframe column names
        self.df_ch_hol = self.df_holidays_by_nation('China') # dataframe of Chinese holidays of the years
        self.df_us_hol = self.df_holidays_by_nation('UnitedStates') # dataframe of American holidays of the years

    def df_holidays_by_nation(self, nation):
        data = country_holidays(country=nation, years = self.ls_years, observed=True)
        df = pd.DataFrame(data.items(), columns=['Date', 'Name'])
        df = df.sort_values(by='Date')

        return df

 

중국 창고 데이터일까 미국 창고 데이터일까?
날짜별 Order_Demand와 
미국/중국 공휴일 여부를 토대로 상관계수를 살펴봄
현재 기초적인 데이터에서는 특징적인 상관계수가 나타나지 않았음

수집할 데이터 2

두 나라의 소비에 영향을 주는 데이터는 무엇일까?
ChatGPT의 답변은 다음과 같다
Three indexes that are mainly used to measure consumer confidence in the United States are:
1. Consumer Confidence Index (CCI) - compiled by The Conference Board, it measures consumer sentiment regarding the overall state of the economy, based on a survey of households.

2. University of Michigan Consumer Sentiment Index (UMCSI) - it surveys households to measure consumers' attitudes and expectations about the economy, as well as their personal financial situation.

3. The Bloomberg Consumer Comfort Index - it's a weekly survey that measures Americans' views on the economy, personal finances, and buying climate.

 

Three indexes that are mainly used to measure consumer confidence in China are:
1. China Consumer Confidence Index (CCCI) - compiled by Nielsen, it measures consumer sentiment regarding the overall state of the economy, based on a survey of households.

2. China Household Finance Index (CHFI) - compiled by People's Bank of China, it measures consumer sentiment regarding the overall state of the household finance, based on a survey of households.

3. China Urban Resident Consumption Confidence Index (URCCI) - compiled by National Bureau of Statistics, it measures consumer sentiment regarding the overall state of urban resident consumption, based on a survey of households.

 

 


 

이 데이터들을 모두 수집가능한가?
어떻게 수집할 것인가?

DBnomics

To be updated..

 

728x90
Comments