Học thuật

Phân tích hồi quy là gì?

(VNF) - Cùng VietnamFinance tìm hiểu Phân tích hồi quy (regression analysis) là gì?

Phân tích hồi quy là gì?

Phân tích hồi quy (regression analysis) là kỹ thuật thống kê dùng để ước lượng phương trình phù hợp nhất với các tập hợp kết quả quan sát của biến phụ thuộc và biến độc lập.

Phân tích hồi quy (regression analysis) là kỹ thuật thống kê dùng để ước lượng phương trình phù hợp nhất với các tập hợp kết quả quan sát của biến phụ thuộc và biến độc lập. Nó cho phép đạt được kết quả ước lượng tốt nhất về mối quan hệ chân thực giữa các biến số. Từ phương trình ước lượng được này, người ta có thể dự báo về biến phụ thuộc (chưa biết) dựa vào giá trị cho trước của biến độc lập (đã biết).

Hãy lấy ví dụ đơn giản nhất về một phương trình tuyến với một biến độc lập và một biến phụ thuộc, chẳng hạn thu nhập sử dụng và chi tiêu cho tiêu dùng. Vấn đề đặt ra là phải vẽ được đường thẳng phù hợp nhất với tập hợp số liệu bao gồm các cặp kết quả quan sát về thu nhập (Y) và tiêu dùng (C).

Hình trên biểu thị tập hợp các kết quả quan sát như thế dưới dạng đồ thị và chúng ta phải tìm phương trình của đường thẳng đó với điều kiện nó phù hợp nhất với số lượng mà chúng ta thu thập được, vì một đường như vậy sẽ đem lại kết quả dự báo tốt nhất cho biến phụ thuộc. Đường thẳng phù hợp nhất với số liệu phải được lựa chọn sao cho giá trị của tổng bình phương các độ lệch (khoảng cách) theo phương thẳng đứng giữa các điểm và đường thẳng là nhỏ nhất. Phương pháp bình phương nhỏ nhất thông thường này được ứng dụng trong hầu hết các phân tích hồi quy. Tính phù hợp của đường hồi quy với các kết quả quan sát mẫu được phản ánh bằng hệ số tương quan.

Đồ thị ở hình trên có thể mô tả bằng phương trình tuyến tính có dạng:

C = C¯ + cY

trong đó C¯ và c là hệ số của phương trình - con số ước tính dựa trên các quan sát đơn lẻ rút ra từ các tham số chân thực tế của tổng thể. Những hẳng số C¯ và c thu được bằng phương pháp bình phương nhỏ nhất thông thường này được gọi là hệ số hồi quy ước lượng được. Khi đã có giá trị bằng số của chúng, người ta sử dụng chúng để dự báo giá trị của biến phụ thuộc C khi biết giá trị của biến độc lập Y.

Ví dụ, nếu hệ số hồi quy ước lượng được của C¯ và c lần lượt là 500 và 0.7, phương trình hồi quy sẽ là C = 500 + 0.7Y, và chúng ta có thể suy ra rằng, nếu thu nhập bằng 10 000 đồng, mức chi tiêu cho tiêu dùng sẽ bằng :

C = 500 + 0.7Y = 500 + 0.7 x 10000 = 7500

Hệ số hồi quy phản ánh độ dốc của đường hồi quy tuyến tính c có ý nghĩa đặc biệt quan trọng trong kinh tế học, vì nó cho thấy sự thay đổi của biến phụ thuộc - trong trường hợp này là biến tiêu dùng - khi có sự thay đổi bằng một đơn vị của biến độc lập - trong trường hợp này là thu nhập. Ví dụ, giá trị của c bằng  0.7 cho thấy người tiêu dùng sẽ chi 70% thu nhập sử dụng tăng thêm cho mục đích tiêu dùng.

Phương trình hồi quy không đem lại dự báo chính xác về biến phụ thuộc khi biết giá trị của biến độc lập. Lý do là các hệ số hồi quy ước lượng được từ kết quả quan sát mẫu chỉ là con số ước lượng tốt nhất cho các tham số chân thực của tổng thể, vì vậy chúng phụ thuộc vào những biến thiên ngẫu nhiên. Kết quả là có thể thiết lập một phân phối có điều kiện để cho các giá trị có khả năng xuất hiện của biến phụ thuộc C do phương trình hồi quy dự báo cho một giá trị cho trước của biến độc lập Y. Độ lệch tiêu chuẩn của phân phối có điều kiện này là chỉ báo về các giới hạn mà chúng ta hy vọng rằng chỉ tiêu cho tiêu dùng sẽ rơi vào đó với một mức thu nhập cho trước. Vấn đề này được phản ánh trong đại lượng thống kê có tên là sai số chuẩn của ước lượng - đại lượng biểu thị các giới hạn ước lượng được mà trong đó chúng ta hy vọng C sẽ rời vào với một Y cho trước và một xác suất cho trước, chẳng hạn 0.95 và 500, khi đó chúng ta có thể tin tưởng rằng trong 95% trường hợp, mức tiêu dùng chân thực tính cho mức thu nhập 10000 đồng sẽ nằm trong khoảng 7500đ - 500 và 7500đ + 500

Để xác nhận tính chấ không hoàn hảo của tất cả các phương trình hồi quy ước lượng được dựa trên một mẫu khi xác định mối quan hệ chân thực trong tổng thể, phương trình hồi quy thường được viết thành:

C = C¯ + cYd + e

tức được bổ sung thêm biểu thức biểu thị phần dư hoặc sai số e để phản ánh tác động phụ thêm của sự biến thiên ngẫu nhiên và những tác động của các biến số độc lập khác, ví dụ lãi suất của tín dụng tiêu dùng - yếu tố ảnh hưởng đến chi tiêu cho tiêu dùng, nhưng không được biểu thị rõ trong phương trình hồi quy.

Khi nghĩ rằng không phải chỉ có một biến số độc lập tác động mạnh tới biến số phụ thuộc, người ta sử dụng phương pháp hồi quy tuyến tính bội. Kỹ thuật này bao gồm việc thiết lập một phương trình hồi quy bội có hai hoặc nhiều biến độc lập. Chẳng hạn:

C = C¯ + bY + di + e

trong đó i là lãi suất của tín dụng tiêu dùng và d là hệ số bội quy bổ sung gắn với biến độc lập bổ sung i. Việc ước lượng phương trình hồi quy bội bằng phương pháp bình phương nhỏ nhất thông thường làm cho đồ thị trong không gian ba chiều phù hợp với các kết quả quan sát mẫu và có thể được sử dụng để ước lượng giá trị của ba hệ số hồi quy C¯, c và d trong phương trình trên.

Khi các mối quan hệ cơ bản giữa những biến số độc lập và phụ thuộc không phải tuyến tính (phi tuyến), phương pháp hồi quy tuyến tính không ứng dụng được. Tuy nhiên, các mối quan hệ có dạng cong (phi tuyến) có thể chuyển thành quan hệ tuyến tính bằng cách sử dụng logarit tự nhiên của các biến số, qua đó làm cho chúng tuân theo phương pháp phân tích hồi quy tuyến tính.

(Tài liệu tham khảo: Nguyễn Văn Ngọc, Từ điển Kinh tế học, Đại học Kinh tế Quốc dân)

Tin mới lên