Dự báo chuỗi thời gian với mô hình ARIMA
Mô hình ARIMA (AutoRegressive Integrated Moving Average) là một trong những phương pháp phổ biến để dự báo chuỗi thời gian. Trong bài viết này, chúng ta sẽ thực hiện xây dựng mô hình ARIMA để phân tích dữ liệu Close
của cổ phiếu.
1️⃣ Cài đặt thư viện cần thiết
Trước tiên, chúng ta cần cài đặt thư viện statsmodels
nếu chưa có:
pip install statsmodels pandas numpy
2️⃣ Xây dựng mô hình ARIMA
Dưới đây là các bước chính để xây dựng mô hình ARIMA:
from statsmodels.tsa.arima.model import ARIMA
import pandas as pd
# Dữ liệu mẫu (có thể thay thế bằng dữ liệu thực tế)
data = pd.DataFrame({
'Datetime': ["2025-03-07", "2025-03-10", "2025-03-11", "2025-03-12", "2025-03-13"],
'Close': [26650.0, 26450.0, 26450.0, 26300.0, 26100.0],
'High': [26800.0, 26750.0, 26450.0, 26700.0, 26450.0],
'Low': [26350.0, 26400.0, 26100.0, 26200.0, 26100.0],
'Open': [26500.0, 26700.0, 26300.0, 26500.0, 26350.0],
'Volume': [12984900, 11003400, 12961400, 8814301, 13510500]
})
# Bước 1: Khởi tạo & Xây dựng mô hình ARIMA
model = ARIMA(data['Close'], order=(5, 1, 0)) # Ví dụ với tham số (p, d, q)
# Bước 2: Huấn luyện mô hình
print(model_fit.summary())
# In ra tóm tắt mô hình
print(model_fit.summary())
3️⃣ Giải thích các tham số mô hình ARIMA
Mô hình ARIMA có ba tham số chính (p, d, q):
p (AutoRegressive - AR): Số lượng độ trễ của chuỗi thời gian. d (Differencing - I): Số lần lấy sai phân để làm dừng chuỗi. q (Moving Average - MA): Số bậc của trung bình trượt.
💡 Ví dụ: (5,1,0): Sử dụng 5 độ trễ, lấy sai phân 1 lần, và không có trung bình trượt. (2,1,2): Sử dụng 2 độ trễ, lấy sai phân 1 lần, và 2 bậc trung bình trượt.
📌 Kết luận Mô hình ARIMA là một công cụ mạnh mẽ để dự báo chuỗi thời gian. Tuy nhiên, việc lựa chọn tham số (p, d, q) phù hợp yêu cầu kiểm tra tính dừng của dữ liệu và tinh chỉnh để đạt kết quả tối ưu.
🔥 Ở bài viết tiếp theo, chúng ta sẽ sử dụng ADF Test để kiểm định tính dừng của chuỗi thời gian! 🚀