Giới thiệu các mô hình dự báo AR ARIMA LSTM

Giới thiệu các mô hình dự báo AR ARIMA LSTM là bước đầu tiên để bạn hiểu cách máy tính dự đoán tương lai từ dữ liệu quá khứ. Trong bài viết này, chúng ta sẽ cùng khám phá cách những mô hình này hoạt động và vì sao chúng lại quan trọng trong lĩnh vực chuỗi thời gian. Ví dụ:

  • Nếu doanh thu tháng trước tăng mạnh, ta hy vọng tháng này vẫn giữ được đà tăng.
  • Nếu hôm nay trời lạnh bất thường, có thể ngày mai cũng chưa ấm lên ngay được.
  • Nếu một cổ phiếu vừa trải qua cú sốc lớn, thị trường sẽ còn phản ứng thêm một thời gian nữa.

Và máy tính cũng được thiết kế để suy luận theo cách tương tự.

Trong thế giới của dữ liệu chuỗi thời gian – nơi mọi giá trị đều gắn với một mốc thời gian cụ thể – có ba mô hình thường được nhắc đến khi nói về dự báo: AR, ARIMA và LSTM. Nghe tên có vẻ phức tạp, nhưng nếu bóc tách từng lớp, bạn sẽ thấy chúng đều xoay quanh một ý tưởng rất con người: quá khứ ảnh hưởng đến hiện tại.

Sau phần Giới thiệu các mô hình dự báo AR ARIMA LSTM ở trên, chúng ta sẽ đi vào từng mô hình cụ thể để hiểu rõ bản chất của chúng.

Giới thiệu các mô hình dự báo AR ARIMA LSTM

AR – Khi hôm nay phụ thuộc hôm qua

AR là viết tắt của AutoRegressive, nghĩa là “tự hồi quy”.
Tên gọi có vẻ học thuật, nhưng bản chất lại rất gần gũi.

Mô hình AR giả định rằng giá trị tại thời điểm hiện tại có thể được ước lượng từ một vài giá trị trước đó. Nói cách khác, để biết hôm nay thế nào, hãy nhìn lại những ngày vừa qua.

Nếu bạn từng nghĩ rằng:

  • Doanh thu hôm nay có liên quan đến doanh thu hôm qua
  • Nhiệt độ ngày mai sẽ không chênh lệch quá xa so với hôm nay
  • Lượng truy cập website buổi tối có xu hướng giống tối hôm trước

… thì bạn đã hiểu trực giác của AR rồi.

AR phù hợp với những chuỗi dữ liệu tương đối “hiền lành”: không quá phức tạp, không biến động quá mạnh, và quan hệ giữa các thời điểm chủ yếu mang tính tuyến tính.

ARIMA – Khi dữ liệu có xu hướng và cần được làm phẳng

Cuộc sống không phải lúc nào cũng phẳng lặng.

  • Doanh thu có thể tăng dần theo năm.
  • Số người dùng internet gần như luôn đi lên.
  • Nhu cầu thị trường có thể thay đổi theo chu kỳ kinh tế.

Lúc này, mô hình AR đơn thuần có thể chưa đủ. Và đó là lúc ARIMA xuất hiện. ARIMA là sự kết hợp giữa ba thành phần:

  • Tự hồi quy (AR)
  • Xử lý xu hướng (I – Integrated)
  • Trung bình trượt của sai số (MA – Moving Average)

Thay vì chỉ nhìn vào quá khứ, ARIMA còn cố gắng “ổn định” chuỗi dữ liệu trước khi dự báo. Nếu chuỗi có xu hướng tăng dần, nó sẽ làm phẳng xu hướng đó, rồi mới tiến hành học.

Trong nhiều thập kỷ, ARIMA từng là “ngôi sao” của lĩnh vực dự báo.
Trong ngân hàng, bán lẻ, logistics hay quản lý tồn kho, ARIMA vẫn được sử dụng rộng rãi vì tính ổn định và khả năng giải thích cao.

Nó giống như một chuyên gia phân tích dữ liệu giàu kinh nghiệm: cẩn trọng, logic, và có phương pháp.

LSTM – Khi máy có “trí nhớ”

Nhưng thế giới dữ liệu ngày nay phức tạp hơn rất nhiều.

  • Giá cổ phiếu không chỉ tăng giảm đơn giản.
  • Hành vi người dùng trên mạng không tuân theo những quy luật tuyến tính.
  • Dữ liệu cảm biến từ nhà máy, xe tự hành hay hệ thống điện chứa đựng những mối quan hệ dài hạn và phi tuyến.

Đó là lúc LSTM bước vào sân khấu. LSTM (Long Short-Term Memory) là một loại mạng nơ-ron đặc biệt thuộc họ Recurrent Neural Network (RNN).
Điểm khác biệt lớn nhất của nó là khả năng “ghi nhớ” thông tin trong thời gian dài.

Nếu AR nhìn lại vài bước trước, thì LSTM có thể học được các mẫu kéo dài hàng chục, thậm chí hàng trăm bước thời gian. Nó không chỉ học “hôm qua ảnh hưởng hôm nay”, mà còn có thể học rằng một sự kiện xảy ra vài tháng trước vẫn còn tác động đến hiện tại.

Vì vậy, LSTM thường được dùng trong:

  • Dự báo tài chính phức tạp
  • Dự báo giao thông
  • Phân tích chuỗi IoT
  • Xử lý ngôn ngữ tự nhiên

Thật thú vị là một câu văn cũng là một chuỗi thời gian – chỉ khác là “thời gian” được thay bằng “thứ tự từ”.

Thư viện Python hiện thực AR, ARIMA và LSTM

Sau khi đã giới thiệu các mô hình dự báo AR, ARIMA, LSTM, câu hỏi tiếp theo thường là: trong thực tế, chúng ta triển khai các mô hình này bằng công cụ nào?  Trong Python, có ba nhóm thư viện phổ biến:

  • statsmodels → cho AR, ARIMA
  • pmdarima → hỗ trợ auto ARIMA
  • TensorFlow / Keras / PyTorch → cho LSTM

Dưới đây là một ví dụ đơn giản để bạn hình dung cách triển khai AR, ARIMA và LSTM trong thực tế:

AR và ARIMA với statsmodels

Thư viện phổ biến nhất cho mô hình thống kê chuỗi thời gian là: statsmodels

import pandas as pd

from statsmodels.tsa.arima.model import ARIMA

# Giả sử df có cột ‘price’

model = ARIMA(df[“price”], order=(1,1,1))  

model_fit = model.fit()

# Dự báo 5 bước tiếp theo

forecast = model_fit.forecast(steps=5)

print(forecast)

Đây là cách triển khai ARIMA trong thực tế.

Sử dụng Auto ARIMA trong pmdarima

from pmdarima import auto_arima

model = auto_arima(df[“price”], seasonal=False)

forecast = model.predict(n_periods=5)

print(forecast)

Thư viện này tự tìm tham số tối ưu.

Dùng  LSTM trong TensorFlow / Keras

LSTM thuộc nhóm Deep Learning nên thường được triển khai bằng TensorFlow, Keras hoặc PyTorch. Ví dụ đơn giản với Keras:

import numpy as np

from tensorflow.keras.models import Sequential

from tensorflow.keras.layers import LSTM, Dense

# reshape dữ liệu (samples, time_steps, features)

X = np.array(X_train)

y = np.array(y_train)

model = Sequential()

model.add(LSTM(50, activation=’relu’, input_shape=(X.shape[1], X.shape[2])))

model.add(Dense(1))

model.compile(optimizer=’adam’, loss=’mse’)

model.fit(X, y, epochs=20, verbose=1)

LSTM yêu cầu dữ liệu được chuẩn bị kỹ hơn so với ARIMA. Thông thường, ta cần:

  • Chuẩn hóa dữ liệu (đưa về cùng thang đo, ví dụ từ 0–1)
  • Chia tập train/test theo thứ tự thời gian (không được shuffle ngẫu nhiên)
  • Chuyển dữ liệu về dạng 3 chiều: (số mẫu, số bước thời gian, số đặc trưng)

Vì LSTM là một mạng nơ-ron xử lý chuỗi, nên nó không nhận dữ liệu dạng bảng 2 chiều thông thường như các mô hình hồi quy.

Bạn cần nắm điều gì lúc này?

Nếu bạn là sinh viên chưa học sâu về các mô hình này, bạn không cần vội vàng lao vào công thức hay đạo hàm. Điều quan trọng nhất là hiểu tư duy phía sau:

  • Dữ liệu thời gian không độc lập.
  • Giá trị hiện tại chịu ảnh hưởng từ quá khứ.
  • Có những mô hình thống kê truyền thống (AR, ARIMA).
  • Có những mô hình Deep Learning hiện đại (LSTM).

Mỗi mô hình đều là một cách tiếp cận khác nhau để trả lời cùng một câu hỏi: Làm sao để dự đoán tương lai dựa trên những gì đã xảy ra?

Một cách hình dung đơn giản

  • AR giống như nhìn lại vài ngày gần nhất rồi đưa ra quyết định.
  • ARIMA giống như nhìn lại xu hướng dài hạn trước khi kết luận.
  • LSTM giống như một bộ não có trí nhớ, có thể nhận ra những mẫu phức tạp ẩn sâu trong dữ liệu.

Lời kết

Bài viết này đã Giới thiệu các mô hình dự báo AR ARIMA LSTM nhằm giúp bạn có cái nhìn tổng quan về cách máy học từ quá khứ để dự đoán tương lai.

Khi hiểu được tư duy phía sau những mô hình này, bạn đã tiến thêm một bước quan trọng trên hành trình học trí tuệ nhân tạo.

Dự báo không phải là đoán mò, mà là quá trình khai thác những cấu trúc ẩn trong dữ liệu theo thời gian. Bởi vì sau cùng, tương lai hiếm khi xuất hiện một cách ngẫu nhiên — nó thường để lại dấu vết của mình trong quá khứ.