Hàm holtwinter trong r thực hiện như thế nào

Đề thi Dự báo 1 NEU

Uploaded by

Hương Giang

100%(1)100% found this document useful (1 vote)

282 views63 pages

Document Information

click to expand document information

Original Title

Đề-thi-Dự-báo-1-NEU

Copyright

© © All Rights Reserved

Share this document

Share or Embed Document

Sharing Options

  • Share on Facebook, opens a new window

    Facebook

  • Share on Twitter, opens a new window

    Twitter

  • Share on LinkedIn, opens a new window

    LinkedIn

  • Share with Email, opens mail client

    Email

  • Copy Link

    Copy Link

Did you find this document useful?

100%100% found this document useful, Mark this document as useful

0%0% found this document not useful, Mark this document as not useful

Is this content inappropriate?

Report this Document

SaveSave Đề-thi-Dự-báo-1-NEU For Later

100%(1)100% found this document useful (1 vote)

282 views63 pages

Đề thi Dự báo 1 NEU

Original Title:

Đề-thi-Dự-báo-1-NEU

Uploaded by

Hương Giang

Full description

SaveSave Đề-thi-Dự-báo-1-NEU For Later

100%100% found this document useful, Mark this document as useful

0%0% found this document not useful, Mark this document as not useful

Embed

Share

Jump to Page

You are on page 1of 63

Search inside document

You're Reading a Free Preview
Pages 7 to 12 are not shown in this preview.

Buy the Full Version

You're Reading a Free Preview
Pages 16 to 19 are not shown in this preview.

Buy the Full Version

You're Reading a Free Preview
Pages 23 to 25 are not shown in this preview.

Buy the Full Version

You're Reading a Free Preview
Pages 29 to 48 are not shown in this preview.

Buy the Full Version

You're Reading a Free Preview
Pages 56 to 62 are not shown in this preview.

Buy the Full Version

Reward Your Curiosity

Everything you want to read.

Anytime. Anywhere. Any device.

No Commitment. Cancel anytime.

Hàm holtwinter trong r thực hiện như thế nào

Share this document

Share or Embed Document

Sharing Options

  • Share on Facebook, opens a new window
  • Share on Twitter, opens a new window
  • Share on LinkedIn, opens a new window
  • Share with Email, opens mail client
  • Copy Link

Quick navigation

  • Home

  • Books

  • Audiobooks

  • Documents

    , active

Các nhiệm vụ dự báo được xây dựng dựa trên sự thay đổi của một số dữ liệu theo thời gian (doanh số, nhu cầu, nguồn cung, GDP, lượng khí thải carbon, dân số ...) và dự đoán những thay đổi này trong tương lai. Thật không may, được xác định trên dữ liệu lịch sử, các xu hướng có thể bị vi phạm bởi nhiều những trường hợp không lường trước được. Vì vậy, dữ liệu trong tương lai có thể khác đáng kể so với những gì đã xảy ra trong quá khứ. Đây là vấn đề với dự báo.

Tuy nhiên, có những kỹ thuật (được gọi là làm mịn theo cấp số nhân) cho phép không chỉ cố gắng dự đoán tương lai mà còn thể hiện bằng số lượng độ không chắc chắn của mọi thứ liên quan đến dự báo. Biểu hiện bằng số của sự không chắc chắn bằng cách tạo ra các khoảng thời gian dự báo thực sự là vô giá, nhưng thường bị bỏ qua trong thế giới dự báo.

Tải xuống ghi chú ở định dạng hoặc, ví dụ ở định dạng

Dữ liệu ban đầu

Giả sử bạn là một người hâm mộ Chúa tể những chiếc nhẫn và đã làm và bán kiếm được ba năm (Hình 1). Hãy hiển thị doanh số bán hàng bằng đồ thị (Hình 2). Nhu cầu đã tăng gấp đôi trong ba năm - có thể đây là một xu hướng? Chúng ta sẽ trở lại ý tưởng này sau một thời gian ngắn. Có một số đỉnh và thung lũng trên biểu đồ, có thể là dấu hiệu của tính theo mùa. Đặc biệt, đỉnh điểm là vào các tháng 12, 24 và 36, là tháng 12. Nhưng có lẽ đó chỉ là một sự trùng hợp ngẫu nhiên? Hãy cùng tìm hiểu.

Hàm holtwinter trong r thực hiện như thế nào

Làm mịn theo cấp số nhân đơn giản

Phương pháp làm mịn theo cấp số nhân dựa trên việc dự đoán tương lai từ dữ liệu từ quá khứ, nơi các quan sát mới hơn có trọng lượng hơn các quan sát cũ hơn. Trọng số như vậy là có thể do các hằng số làm mịn. Phương pháp làm mịn theo cấp số nhân đầu tiên mà chúng tôi sẽ thử được gọi là làm mịn theo cấp số nhân đơn giản (SES). Nó chỉ sử dụng một hằng số làm mịn.

Làm trơn theo cấp số nhân đơn giản giả định rằng chuỗi thời gian dữ liệu của bạn có hai thành phần: mức (hoặc trung bình) và một số lỗi xung quanh giá trị đó. Không có xu hướng hoặc biến động theo mùa - chỉ có một mức mà nhu cầu dao động xung quanh, được bao quanh bởi các sai số nhỏ ở đây và ở đó. Bằng cách ưu tiên các quan sát mới hơn, TEC có thể gây ra sự thay đổi trong cấp độ này. Trong ngôn ngữ của công thức,

Cầu tại thời điểm t = mức + sai số ngẫu nhiên xung quanh mức tại thời điểm t

Vì vậy, làm thế nào để bạn tìm thấy giá trị gần đúng của mức độ? Nếu chúng ta chấp nhận tất cả các giá trị thời gian là có cùng một giá trị, thì chúng ta chỉ nên tính giá trị trung bình của chúng. Tuy nhiên, đây là một ý tưởng tồi. Cần có nhiều trọng lượng hơn cho các quan sát gần đây.

Hãy tạo một số cấp độ. Tính đường cơ sở cho năm đầu tiên:

mức 0 = nhu cầu trung bình trong năm đầu tiên (tháng 1-12)

Đối với nhu cầu kiếm, nó là 163. Chúng tôi sử dụng mức 0 (163) làm dự báo nhu cầu cho tháng 1. Nhu cầu trong tháng 1 là 165, cao hơn 2 kiếm trên mức 0. Nó là giá trị cập nhật ước lượng cơ sở. Phương trình làm trơn hàm mũ đơn giản:

cấp độ 1 = cấp độ 0 + một vài phần trăm × (nhu cầu 1 - cấp độ 0)

cấp độ 2 = cấp độ 1 + một vài phần trăm × (nhu cầu 2 - cấp độ 1)

Vân vân. "Một vài phần trăm" được gọi là hằng số làm mịn và được ký hiệu là alpha. Nó có thể là bất kỳ số nào từ 0 đến 100% (0 đến 1). Bạn sẽ học cách chọn giá trị alpha sau. TẠI trường hợp chung giá trị cho các điểm khác nhau trong thời gian:

Mức giai đoạn hiện tại = mức giai đoạn trước +
alpha × (nhu cầu giai đoạn hiện tại - mức giai đoạn trước)

Nhu cầu trong tương lai bằng với mức tính toán cuối cùng (Hình 3). Vì bạn không biết alpha là gì, hãy đặt ô C2 thành 0,5 để bắt đầu. Sau khi xây dựng mô hình, hãy tìm một alpha sao cho tổng các bình phương của lỗi là E2 (hoặc độ lệch chuẩn- F2) là tối thiểu. Để làm điều này, hãy chạy tùy chọn Tìm giải pháp. Để thực hiện việc này, hãy chuyển qua menu DỮ LIỆU –> Tìm giải pháp và đặt trong cửa sổ Các tùy chọn tìm kiếm giải pháp giá trị yêu cầu (Hình 4). Để hiển thị kết quả dự báo trên biểu đồ, trước tiên hãy chọn phạm vi A6: B41 và xây dựng một biểu đồ đường đơn giản. Tiếp theo, nhấp chuột phải vào sơ đồ, chọn tùy chọn Chọn dữ liệu. Trong cửa sổ mở ra, hãy tạo hàng thứ hai và chèn các dự đoán từ phạm vi A42: B53 vào đó (Hình 5).

Hàm holtwinter trong r thực hiện như thế nào

Hàm holtwinter trong r thực hiện như thế nào

Hàm holtwinter trong r thực hiện như thế nào

Có thể bạn có một xu hướng

Để kiểm tra giả định này, nó đủ để phù hợp với hồi quy tuyến tính dưới dữ liệu nhu cầu và thực hiện kiểm tra t về sự gia tăng của đường xu hướng này (như trong). Nếu hệ số góc của đường thẳng khác 0 và có ý nghĩa thống kê (trong bài kiểm tra của Học sinh, giá trị R nhỏ hơn 0,05), dữ liệu có xu hướng (Hình 6).

Hàm holtwinter trong r thực hiện như thế nào

Chúng tôi đã sử dụng hàm LINEST, trả về 10 thống kê mô tả(nếu bạn chưa sử dụng chức năng này trước đây, tôi khuyên bạn nên sử dụng nó) và hàm INDEX, cho phép bạn chỉ "lấy ra" ba thống kê bắt buộc chứ không phải toàn bộ. Nó chỉ ra rằng độ dốc là 2,54, và nó là đáng kể, vì bài kiểm tra của Học sinh cho thấy rằng 0,000000012 nhỏ hơn đáng kể 0,05. Vì vậy, có một xu hướng và vẫn phải đưa nó vào dự báo.

Làm mịn Holt theo cấp số nhân với hiệu chỉnh xu hướng

Nó thường được gọi là làm mịn hàm mũ kép vì nó có hai tham số làm mịn, alpha, thay vì một. Nếu chuỗi thời gian có xu hướng tuyến tính, thì:

cầu theo thời gian t = mức + t × xu hướng + độ lệch ngẫu nhiên mức tại thời điểm t

Holt Exponential Smoothing với hiệu chỉnh xu hướng có hai phương trình mới, một phương trình cho mức khi nó di chuyển về phía trước theo thời gian và phương trình còn lại cho xu hướng. Phương trình mức chứa tham số làm mịn alpha và phương trình xu hướng chứa gamma. Đây là phương trình cấp mới trông như thế nào:

mức 1 = mức 0 + xu hướng 0 + alpha × (nhu cầu 1 - (mức 0 + xu hướng 0))

lưu ý rằng mức 0 + xu hướng 0 chỉ là dự báo một bước từ các giá trị ban đầu đến tháng 1, vì vậy nhu cầu 1 - (mức 0 + xu hướng 0) là sai lệch một bước. Do đó, phương trình xấp xỉ mức cơ bản sẽ như sau:

mức giai đoạn hiện tại = mức giai đoạn trước + xu hướng giai đoạn trước + alpha × (nhu cầu giai đoạn hiện tại - (mức giai đoạn trước) + xu hướng giai đoạn trước))

Phương trình cập nhật xu hướng:

xu hướng giai đoạn hiện tại = xu hướng giai đoạn trước + gamma × alpha × (nhu cầu giai đoạn hiện tại - (mức độ giai đoạn trước) + xu hướng giai đoạn trước))

Làm mịn Holt trong Excel tương tự như làm mịn đơn giản (Hình 7), và như trên, mục tiêu là tìm hai hệ số trong khi giảm thiểu tổng sai số bình phương (Hình 8). Để có được mức ban đầu và giá trị xu hướng (trong ô C5 và D5 trong Hình 7), hãy xây dựng biểu đồ cho doanh số bán hàng trong 18 tháng đầu tiên và thêm một đường xu hướng vào đó bằng một phương trình. Nhập giá trị xu hướng ban đầu là 0,8369 và mức ban đầu là 155,88 vào các ô C5 và D5. Dữ liệu dự báo có thể được trình bày dưới dạng đồ thị (Hình 9).

Hàm holtwinter trong r thực hiện như thế nào

Cơm. 7. Làm mịn Holt theo cấp số nhân với điều chỉnh xu hướng; Để phóng to hình ảnh, nhấp chuột phải vào hình ảnh đó và chọn Mở hình ảnh trong trang mới

Hàm holtwinter trong r thực hiện như thế nào

Hàm holtwinter trong r thực hiện như thế nào

Tìm kiếm các mẫu trong dữ liệu

Có một cách để kiểm tra độ mạnh của mô hình dự đoán - để so sánh các lỗi với chính chúng, được dịch chuyển theo một bước (hoặc một số bước). Nếu sai lệch là ngẫu nhiên thì không thể cải thiện mô hình. Tuy nhiên, có thể có một yếu tố mùa trong dữ liệu nhu cầu. Khái niệm về một lỗi tương quan với phiên bản của chính nó trong một khoảng thời gian khác được gọi là tự tương quan (để biết thêm về tự tương quan, xem). Để tính toán tự tương quan, hãy bắt đầu với dữ liệu sai số dự báo cho từng thời kỳ (chuyển cột F trong Hình 7 sang cột B trong Hình 10). Tiếp theo xác định lỗi trung bình dự báo (Hình 10, ô B39; công thức trong ô: = AVERAGE (B3: B38)). Trong cột C, tính toán độ lệch của sai số dự báo so với giá trị trung bình; công thức trong ô C3: = B3-B $ 39. Tiếp theo, tuần tự chuyển cột C một cột sang bên phải và một hàng xuống dưới. Công thức trong ô D39: = SUMPRODUCT ($ C3: $ C38, D3: D38), D41: = D39 / $ C39, D42: = 2 / SQRT (36), D43: = -2 / SQRT (36).

Hàm holtwinter trong r thực hiện như thế nào

“Chuyển động đồng bộ” với cột C có thể có ý nghĩa gì đối với một trong các cột D: O. Ví dụ: nếu cột C và D là đồng bộ, thì một số âm ở một trong số chúng phải âm ở cột kia, dương ở một , tích cực trong bạn bè. Điều này có nghĩa là tổng các tích của hai cột sẽ là đáng kể (sự khác biệt tích lũy). Hoặc, tương tự, giá trị trong phạm vi D41: O41 càng gần bằng 0, thì mối tương quan của cột (tương ứng từ D đến O) với cột C càng thấp (Hình 11).

Hàm holtwinter trong r thực hiện như thế nào

Một tự tương quan nằm trên giá trị tới hạn. Sai số chuyển năm tương quan với chính nó. Điều này có nghĩa là chu kỳ 12 tháng theo mùa. Và điều này không có gì đáng ngạc nhiên. Nếu bạn nhìn vào đồ thị nhu cầu (Hình 2), nó chỉ ra rằng nhu cầu đạt đỉnh vào mỗi dịp Giáng sinh và giảm xuống vào tháng 4-5. Hãy xem xét một kỹ thuật dự báo có tính đến tính thời vụ.

Làm mịn Holt-Winters theo cấp số nhân

Phương pháp này được gọi là nhân (từ nhân - nhân), bởi vì nó sử dụng phép nhân để tính theo mùa:

Nhu cầu tại thời điểm t = (mức + t × xu hướng) × điều chỉnh theo mùa tại thời điểm t × bất kỳ điều chỉnh bất thường nào còn lại mà chúng tôi không thể tính đến

Làm mịn Holt-Winters còn được gọi là làm mịn ba hàm mũ vì nó có ba tham số làm mịn (alpha, gamma và hệ số theo mùa delta). Ví dụ: nếu có chu kỳ theo mùa 12 tháng:

Dự báo hàng tháng 39 = (mức 36 + 3 × xu hướng 36) x tính thời vụ 27

Khi phân tích dữ liệu, cần tìm ra xu hướng trong chuỗi dữ liệu và đâu là tính thời vụ. Để thực hiện các phép tính bằng phương pháp Holt-Winters, bạn phải:

  • Dữ liệu lịch sử mượt mà bằng cách sử dụng phương pháp trung bình động.
  • So sánh phiên bản làm mịn của chuỗi thời gian với phiên bản gốc để có ước tính sơ bộ về tính thời vụ.
  • Nhận dữ liệu mới mà không có thành phần theo mùa.
  • Tìm mức độ và xu hướng gần đúng dựa trên dữ liệu mới này.

Bắt đầu với dữ liệu ban đầu (cột A và B trong Hình 12) và thêm cột C với các giá trị được làm mịn dựa trên đường trung bình. Vì tính thời vụ có chu kỳ 12 tháng, nên sử dụng giá trị trung bình 12 tháng là hợp lý. Có một vấn đề nhỏ với mức trung bình này. 12 là một số chẵn. Nếu bạn giải quyết nhu cầu cho tháng 7, thì nó nên được coi là nhu cầu trung bình từ tháng 1 đến tháng 12, hay từ 2 đến 13? Để giải quyết khó khăn này, chúng ta cần giải quyết nhu cầu bằng cách sử dụng "đường trung bình động 2x12". Nghĩa là, lấy một nửa của hai giá trị trung bình từ tháng 1 đến tháng 12 và từ tháng 2 đến tháng 13. Công thức trong ô C8 là: = (AVERAGE (B3: B14) + AVERAGE (B2: B13)) / 2.

Hàm holtwinter trong r thực hiện như thế nào

Không thể thu thập dữ liệu mượt mà cho các tháng 1–6 và 31–36 vì không có đủ các khoảng thời gian trước đó và tiếp theo. Để rõ ràng, dữ liệu gốc và dữ liệu được làm mịn có thể được hiển thị trong một biểu đồ (Hình 13).

Hàm holtwinter trong r thực hiện như thế nào

Bây giờ, trong cột D, hãy chia giá trị ban đầu cho giá trị được làm mịn để có được ước tính điều chỉnh theo mùa (cột D trong Hình 12). Công thức trong ô D8: = B8 / C8. Lưu ý mức tăng đột biến 20% so với nhu cầu bình thường trong tháng 12 và 24 (tháng 12) trong khi có sự sụt giảm vào mùa xuân. Kỹ thuật làm mịn này đã mang lại cho bạn hai ước tính điểm cho mỗi tháng (tổng cộng 24 tháng). Cột E là giá trị trung bình của hai yếu tố này. Công thức trong ô E1 là: = AVERAGE (D14, D26). Để rõ ràng, mức độ dao động theo mùa có thể được biểu diễn bằng đồ thị (Hình 14).

Hàm holtwinter trong r thực hiện như thế nào

Giờ đây, bạn có thể nhận dữ liệu được điều chỉnh theo mùa. Công thức trong ô G1: = B2 / E2. Xây dựng biểu đồ dựa trên dữ liệu trong cột G, hoàn thành nó bằng một đường xu hướng, hiển thị phương trình xu hướng trên biểu đồ (Hình 15) và sử dụng các hệ số trong các tính toán tiếp theo.

Hàm holtwinter trong r thực hiện như thế nào

biểu mẫu lá mới, như được hiển thị trong hình. 16. Thay thế các giá trị trong phạm vi E5: E16 từ hình. 12 khu vực E2: E13. Lấy các giá trị của C16 và D16 từ phương trình của đường xu hướng trong hình. 15. Đặt các giá trị của hằng số làm mịn bắt đầu ở khoảng 0,5. Mở rộng các giá trị trong hàng 17 trong phạm vi từ tháng 1 đến tháng 36. Chạy Tìm giải phápđể tối ưu hóa hệ số làm mịn (Hình 18). Công thức trong ô B53: = (C $ 52 + (A53-A $ 52) * D $ 52) * E41.

Hàm holtwinter trong r thực hiện như thế nào

Hàm holtwinter trong r thực hiện như thế nào

Bây giờ trong dự báo được thực hiện, bạn cần kiểm tra các tương quan tự động (Hình 18). Vì tất cả các giá trị đều nằm giữa ranh giới trên và dưới, bạn hiểu rằng mô hình đã làm rất tốt việc hiểu cấu trúc của giá trị nhu cầu.

Hàm holtwinter trong r thực hiện như thế nào

Xây dựng khoảng tin cậy cho dự báo

Vì vậy, chúng tôi có một dự báo khá hiệu quả. Làm thế nào để bạn đặt giới hạn trên và giới hạn dưới có thể được sử dụng để đưa ra các phỏng đoán thực tế? Mô phỏng Monte Carlo, mà bạn đã gặp (xem thêm), sẽ giúp bạn điều này. Vấn đề là tạo ra các kịch bản về hành vi nhu cầu trong tương lai và xác định nhóm mà 95% trong số họ rơi vào.

Xóa khỏi trang tính Dự báo Excel từ các ô B53: B64 (xem Hình 17). Bạn sẽ viết nhu cầu ở đó dựa trên mô phỏng. Sau này có thể được tạo bằng hàm NORMINV. Đối với các tháng trong tương lai, bạn chỉ cần cung cấp giá trị trung bình (0), phân phối chuẩn (10,37 từ ô $ H $ 2) và số ngẫu nhiên từ 0 đến 1. Hàm sẽ trả về độ lệch với xác suất tương ứng với đường cong hình chuông. Đặt mô phỏng lỗi một bước trong ô G53: = NORMINV (RAND (); 0; H $ 2). Kéo dài công thức này xuống G64 cung cấp cho bạn các mô phỏng về lỗi dự báo cho dự báo một bước trong 12 tháng (Hình 19). Giá trị mô phỏng của bạn sẽ khác với giá trị được hiển thị trong hình (đó là lý do tại sao nó là mô phỏng!).

Hàm holtwinter trong r thực hiện như thế nào

Với Lỗi dự báo, bạn có mọi thứ cần thiết để cập nhật mức độ, xu hướng và yếu tố theo mùa. Vì vậy, hãy chọn các ô C52: F52 và kéo dài chúng thành hàng 64. Kết quả là bạn có một lỗi dự báo mô phỏng và chính dự báo đó. Đi ngược lại, có thể dự đoán các giá trị của cầu. Chèn công thức vào ô B53: = F53 + G53 và kéo dài nó thành B64 (Hình 20, phạm vi B53: F64). Bây giờ bạn có thể nhấn nút F9, mỗi lần cập nhật dự báo. Đặt kết quả của 1000 mô phỏng vào các ô A71: L1070, mỗi lần chuyển các giá trị từ phạm vi B53: B64 sang phạm vi A71: L71, A72: L72, ... A1070: L1070. Nếu nó làm phiền bạn, hãy viết mã VBA.

Hàm holtwinter trong r thực hiện như thế nào

Giờ đây, bạn có 1000 tình huống cho mỗi tháng và bạn có thể sử dụng hàm PERCENTILE để lấy giới hạn trên và giới hạn dưới ở giữa khoảng tin cậy 95%. Trong ô A66, công thức là: = PERCENTILE (A71: A1070,0.975) và trong ô A67: = PERCENTILE (A71: A1070,0.025).

Như thường lệ, để rõ ràng, dữ liệu có thể được trình bày trong dạng đồ họa(Hình 21).

Hàm holtwinter trong r thực hiện như thế nào

Có hai điểm thú vị trên biểu đồ:

  • Biên độ sai số tăng dần theo thời gian. Nó có ý nghĩa. Sự không chắc chắn tích lũy hàng tháng.
  • Theo cách tương tự, sai số tăng lên ở các bộ phận rơi vào thời kỳ nhu cầu tăng theo mùa. Với sự sụp đổ tiếp theo của nó, lỗi sẽ giảm dần.

Dựa trên tài liệu từ một cuốn sách của John Foreman. - M.: Nhà xuất bản Alpina, 2016. - S. 329–381

Chủ đề 3. Làm mịn và dự báo chuỗi thời gian dựa trên mô hình xu hướng

mục đích Việc nghiên cứu đề tài này là tạo cơ sở cơ bản cho việc đào tạo cán bộ quản lý chuyên ngành 080507 trong lĩnh vực xây dựng các mô hình nhiệm vụ khác nhau trong lĩnh vực kinh tế, hình thành phương pháp tiếp cận có hệ thống để đặt và giải quyết các vấn đề dự báo trong sinh viên. . Khóa học được đề xuất sẽ cho phép các chuyên gia nhanh chóng thích ứng với công việc thực tế, tốt hơn là bạn nên tìm hiểu thông tin và tài liệu khoa học kỹ thuật trong chuyên ngành, để đưa ra những quyết định tự tin hơn nảy sinh trong công việc.

Chủ yếu nhiệm vụ chủ đề nghiên cứu là: tìm hiểu sâu về sinh viên kiến thức lý thuyết về việc áp dụng các mô hình dự báo, họ có được các kỹ năng ổn định trong việc thực hiện công việc nghiên cứu, khả năng giải quyết các vấn đề phức tạp vấn đề khoa học gắn liền với việc xây dựng các mô hình, bao gồm cả những mô hình đa chiều, khả năng phân tích một cách logic các kết quả thu được và xác định cách thức để tìm ra các giải pháp có thể chấp nhận được.

Đầy đủ phương pháp đơn giản xác định xu hướng phát triển là việc làm mượt chuỗi thời gian, tức là thay thế các mức thực tế bằng các mức được tính toán có các biến thể nhỏ hơn dữ liệu ban đầu. Phép biến đổi tương ứng được gọi là lọc. Hãy xem xét một số phương pháp làm mịn.

3.1. trung bình đơn giản

Mục tiêu của việc làm mịn là xây dựng một mô hình dự báo cho các giai đoạn trong tương lai dựa trên các quan sát trong quá khứ. Trong phương pháp tính trung bình đơn giản, các giá trị của biến được lấy làm dữ liệu ban đầu Y tại các thời điểm t và giá trị dự báo được xác định là giá trị trung bình đơn giản cho khoảng thời gian tiếp theo. Công thức tính có hình thức

Hàm holtwinter trong r thực hiện như thế nào

ở đâu N là số lần quan sát.

Trong trường hợp khi có quan sát mới thì dự báo mới nhận được cũng cần được tính đến để dự báo cho thời kỳ tiếp theo. Khi sử dụng phương pháp này, dự báo được thực hiện bằng cách lấy trung bình tất cả các dữ liệu trước đó, tuy nhiên, nhược điểm của phương pháp dự báo này là khó sử dụng nó trong các mô hình xu hướng.

3.2. Phương pháp trung bình động

Phương pháp này dựa trên việc biểu diễn chuỗi dưới dạng tổng của một xu hướng khá suôn sẻ và thành phần ngẫu nhiên. Phương pháp này dựa trên ý tưởng tính toán giá trị lý thuyết dựa trên giá trị gần đúng cục bộ. Để xây dựng ước tính xu hướng tại một điểm t bởi các giá trị của chuỗi trong khoảng thời gian tính giá trị lý thuyết của dãy số. Phổ biến nhất trong thực hành làm trơn chuỗi, tôi gặp trường hợp khi tất cả các trọng số cho các phần tử của khoảng bằng nhau. Vì lý do này, phương pháp này được gọi là phương pháp trung bình động, kể từ khi thủ tục được thực thi, một cửa sổ có chiều rộng là (2 m + 1) trong suốt hàng. Chiều rộng cửa sổ thường được lấy lẻ, vì giá trị lý thuyết được tính cho giá trị trung tâm: số điều khoản k = 2m + 1 với Cùng một số cấp độ bên trái và bên phải của thời điểm t.

Công thức tính trung bình động trong trường hợp này có dạng:

Hàm holtwinter trong r thực hiện như thế nào

Sự phân tán của đường trung bình động được định nghĩa là σ 2 / k, qua đâu σ2 biểu thị phương sai của các thuật ngữ ban đầu của chuỗi, và k- khoảng thời gian làm mịn, do đó, khoảng thời gian làm mịn càng lớn thì giá trị trung bình của dữ liệu càng mạnh và xu hướng đã xác định càng ít thay đổi. Thông thường, làm mịn được thực hiện trên ba, năm và bảy thành viên của loạt phim gốc. Đồng thời, người ta nên tính đến các tính năng sau trung bình động: nếu chúng ta xem xét một chuỗi với biến động định kỳ có độ dài không đổi, việc làm mịn dựa trên đường trung bình động với khoảng thời gian làm mịn bằng hoặc bội số của chu kỳ sẽ loại bỏ hoàn toàn các dao động. Thông thường, việc làm mịn dựa trên đường trung bình biến đổi chuỗi mạnh mẽ đến mức xu hướng phát triển đã xác định chỉ được biểu hiện trong hầu hết trong các điều khoản chung, và nhỏ hơn, nhưng quan trọng đối với các chi tiết phân tích (sóng, khúc cua, v.v.) biến mất; sau khi làm mịn, các sóng nhỏ đôi khi có thể đổi hướng ngược lại - "hố" xuất hiện thay cho "đỉnh" và ngược lại. Tất cả điều này đòi hỏi sự thận trọng trong việc sử dụng đường trung bình động đơn giản và buộc người ta phải tìm kiếm các phương pháp mô tả tinh tế hơn.

Phương pháp trung bình động không cung cấp giá trị xu hướng cho giá trị đầu tiên và cuối cùng m thành viên hàng. Thiếu sót này đặc biệt dễ nhận thấy trong trường hợp chiều dài của hàng nhỏ.

3.3. Làm mịn theo cấp số nhân

Trung bình theo cấp số nhân y t là một ví dụ về đường trung bình động có trọng số không đối xứng có tính đến mức độ già hóa của dữ liệu: thông tin "cũ hơn" với ít trọng số hơn sẽ nhập công thức để tính giá trị làm mịn của mức độ của chuỗi

Đây — hàm mũ có nghĩa là thay thế giá trị quan sát của chuỗi y t(làm mịn liên quan đến tất cả dữ liệu nhận được thời điểm hiện tại t), α là một tham số làm mịn đặc trưng cho trọng số của quan sát hiện tại (mới nhất); 0< α <1.

Phương pháp được sử dụng để dự đoán chuỗi thời gian không cố định với những thay đổi ngẫu nhiên về mức độ và độ dốc. Khi chúng ta rời xa thời điểm hiện tại về quá khứ, trọng số của số hạng tương ứng của chuỗi giảm nhanh chóng (theo cấp số nhân) và thực tế không còn ảnh hưởng gì đến giá trị của.

Dễ dàng nhận thấy rằng quan hệ cuối cùng cho phép chúng ta đưa ra cách giải thích sau đây về trung bình hàm mũ: nếu — dự đoán giá trị chuỗi y t, thì sự khác biệt là sai số dự báo. Vì vậy, dự đoán cho thời điểm tiếp theo t + 1 tính đến những gì đã được biết vào lúc này t dự báo lỗi.

Tùy chọn làm mịn α là một yếu tố cân. Nếu α gần như thống nhất, thì dự báo có tính đến độ lớn của sai số của dự báo cuối cùng. Đối với các giá trị nhỏ α giá trị dự đoán gần với dự đoán trước đó. Việc lựa chọn tham số làm mịn là một vấn đề khá phức tạp. Những cân nhắc chung như sau: phương pháp tốt để dự đoán chuỗi đủ mượt. Trong trường hợp này, người ta có thể chọn một hằng số làm mịn bằng cách giảm thiểu sai số dự đoán trước một bước được ước tính từ một phần ba cuối cùng của chuỗi. Một số chuyên gia không khuyến nghị sử dụng các giá trị lớn của tham số làm mịn. Trên hình. 3.1 cho thấy một ví dụ về một chuỗi được làm mịn bằng cách sử dụng phương pháp làm mịn theo cấp số nhân cho α= 0,1.

Hàm holtwinter trong r thực hiện như thế nào

Cơm. 3.1. Kết quả của việc làm mịn theo cấp số nhân tại α =0,1
(1 - hàng gốc; 2 - hàng làm mịn; 3 - hàng dư)

3.4. Làm mịn theo cấp số nhândựa trên xu hướng (phương pháp Holt)

Phương pháp này có tính đến xu hướng tuyến tính cục bộ tồn tại trong chuỗi thời gian. Nếu có một xu hướng đi lên trong chuỗi thời gian, thì cùng với ước tính mức hiện tại, ước tính độ dốc cũng là cần thiết. Trong kỹ thuật Holt, các giá trị mức và độ dốc được làm mịn trực tiếp bằng cách sử dụng các hằng số khác nhau cho từng tham số. Các hằng số làm mịn cho phép bạn ước tính mức độ và độ dốc hiện tại, tinh chỉnh chúng mỗi khi thực hiện các quan sát mới.

Phương pháp Holt sử dụng ba công thức tính toán:

  1. Chuỗi làm mịn theo cấp số nhân (Ước tính mức hiện tại)

(3.2)

  1. Đánh giá xu hướng

(3.3)

  1. Dự báo cho R kỳ trước

Hàm holtwinter trong r thực hiện như thế nào

(3.4)

ở đâu α, β đang làm mịn các hằng số trong khoảng thời gian.

Phương trình (3.2) tương tự như Phương trình (3.1) để làm trơn hàm mũ đơn giản ngoại trừ thuật ngữ có xu hướng. Liên tục β cần thiết để làm suôn sẻ ước tính xu hướng. Trong phương trình dự báo (3.3), ước tính xu hướng được nhân với số giai đoạn R, dựa trên dự báo và sau đó sản phẩm này được thêm vào cấp dữ liệu làm mịn hiện tại.

Dài hạn α và β được chọn một cách chủ quan hoặc bằng cách giảm thiểu sai số dự đoán. Các giá trị trọng số càng lớn được thực hiện thì phản ứng đối với các thay đổi đang diễn ra càng nhanh và dữ liệu sẽ được làm mịn hơn. Trọng lượng nhỏ hơn làm cho cấu trúc của các giá trị được làm mịn kém phẳng hơn.

Trên hình. 3.2 cho thấy một ví dụ về làm mịn một chuỗi bằng phương pháp Holt cho các giá trị α và β bằng 0,1.

Hàm holtwinter trong r thực hiện như thế nào

Cơm. 3.2. Kết quả làm mịn Holt
tại α = 0,1 và β = 0,1

3.5. Làm mịn theo cấp số nhân với các biến thể theo xu hướng và theo mùa (Phương pháp mùa đông)

Nếu có những biến động theo mùa trong cấu trúc dữ liệu, mô hình làm mịn hàm mũ ba tham số do Winters đề xuất được sử dụng để giảm sai số dự báo. Cách tiếp cận này là một phần mở rộng của mô hình Holt trước đó. Để giải thích các biến đổi theo mùa, một phương trình bổ sung được sử dụng ở đây và phương pháp này được mô tả đầy đủ bằng bốn phương trình:

  1. Chuỗi trơn tru theo cấp số nhân

Hàm holtwinter trong r thực hiện như thế nào

(3.5)

  1. Đánh giá xu hướng

(3.6)

  1. Đánh giá tính thời vụ

Hàm holtwinter trong r thực hiện như thế nào
.

(3.7)

  1. Dự báo cho R kỳ trước

(3.8)

ở đâu α, β, γ - làm mịn liên tục đối với mức độ, xu hướng và tính thời vụ, tương ứng; S- khoảng thời gian của thời kỳ biến động theo mùa.

Phương trình (3.5) hiệu chỉnh chuỗi được làm mịn. Trong phương trình này, thuật ngữ tính đến tính thời vụ trong dữ liệu ban đầu. Sau khi tính đến tính thời vụ và xu hướng trong các phương trình (3.6), (3.7), các ước tính được làm phẳng và dự báo được đưa ra trong phương trình (3.8).

Cũng giống như trong phương pháp trước, trọng số α, β, γ có thể được chọn một cách chủ quan hoặc bằng cách giảm thiểu sai số dự đoán. Trước khi áp dụng phương trình (3.5), cần xác định các giá trị ban đầu cho chuỗi được làm mịn L t, xu hướng T, hệ số thời vụ S t. Thông thường, giá trị ban đầu của chuỗi được làm mịn được lấy bằng lần quan sát đầu tiên, sau đó xu hướng bằng 0 và các hệ số theo mùa được đặt bằng một.

Trên hình. 3.3 cho thấy một ví dụ về làm mịn một chuỗi bằng phương pháp Winters.

Hàm holtwinter trong r thực hiện như thế nào

Cơm. 3.3. Kết quả của việc làm mịn bằng phương pháp Winters
tại α = 0,1 ;β = 0,1; γ = 0,1(1 - hàng gốc; 2 - hàng làm mịn; 3 - hàng dư)

3.6. Dự báo dựa trên các mô hình xu hướng

Các chuỗi thời gian khá thường xuyên có một xu hướng tuyến tính (xu hướng). Giả sử xu hướng tuyến tính, bạn cần phải xây dựng một đường thẳng phản ánh chính xác nhất sự thay đổi về động lực trong khoảng thời gian được xem xét. Có một số phương pháp để xây dựng một đường thẳng, nhưng mục tiêu nhất theo quan điểm chính thức sẽ là một cách xây dựng dựa trên việc giảm thiểu tổng các độ lệch âm và dương của các giá trị ban đầu của chuỗi từ một đường thẳng.

Một đường thẳng trong hệ hai tọa độ (x, y) có thể được định nghĩa là giao điểm của một trong các tọa độ tại và góc nghiêng với trục X. Phương trình của một đường thẳng như vậy sẽ giống như

Hàm holtwinter trong r thực hiện như thế nào
ở đâu một- giao điểm; b- góc nghiêng.

Để đường thẳng phản ánh quá trình chuyển động, cần phải giảm thiểu tổng các độ lệch dọc. Khi sử dụng một tổng độ lệch đơn giản làm tiêu chí để ước tính mức tối thiểu hóa, kết quả sẽ không tốt lắm, vì độ lệch âm và dương triệt tiêu lẫn nhau. Việc giảm thiểu tổng các giá trị tuyệt đối cũng không dẫn đến kết quả khả quan, vì các ước lượng tham số trong trường hợp này không ổn định, cũng có những khó khăn về tính toán khi thực hiện quy trình ước lượng như vậy. Do đó, thủ tục được sử dụng phổ biến nhất là giảm thiểu tổng các độ lệch bình phương, hoặc phương pháp bình phương nhỏ nhất(MNK).

Vì chuỗi các giá trị ban đầu có sự dao động, mô hình của chuỗi sẽ có lỗi, các bình phương của chúng phải được tối thiểu hóa

Hàm holtwinter trong r thực hiện như thế nào

trong đó y i là giá trị quan sát được; y i * là các giá trị lý thuyết của mô hình; - số quan sát.

Khi mô hình hóa xu hướng của chuỗi thời gian gốc bằng cách sử dụng xu hướng tuyến tính, chúng tôi sẽ giả định rằng

Chia phương trình đầu tiên cho N, chúng tôi đến nơi tiếp theo

Hàm holtwinter trong r thực hiện như thế nào

Thay biểu thức kết quả vào phương trình thứ hai của hệ (3.10), cho hệ số b * chúng tôi nhận được:

Hàm holtwinter trong r thực hiện như thế nào

3.7. Kiểm tra phù hợp mô hình

Ví dụ, trong hình. 3.4 cho thấy một đồ thị hồi quy tuyến tính giữa công suất của ô tô X và chi phí của nó tại.

Hàm holtwinter trong r thực hiện như thế nào

Cơm. 3.4. Biểu đồ hồi quy tuyến tính

Phương trình cho trường hợp này là: tại=1455,3 + 13,4 X. Phân tích trực quan hình này cho thấy rằng đối với một số quan sát, có sự sai lệch đáng kể so với đường cong lý thuyết. Đồ thị phần dư được thể hiện trong Hình. 3.5.

Hàm holtwinter trong r thực hiện như thế nào

Cơm. 3.5. Biểu đồ dư lượng

Phân tích phần dư của đường hồi quy có thể cung cấp một thước đo hữu ích về mức độ phản ánh của hồi quy ước tính với dữ liệu thực. Một hồi quy tốt là một hồi quy giải thích một lượng lớn phương sai và ngược lại, một hồi quy xấu không theo dõi một lượng lớn biến động trong dữ liệu ban đầu. Trực quan rõ ràng rằng bất kỳ thông tin bổ sung nào sẽ cải thiện mô hình, tức là giảm phần biến thể không giải thích được tại. Để phân tích hồi quy, chúng ta sẽ phân tích phương sai thành các thành phần. Hiển nhiên là

Số hạng cuối cùng sẽ bằng 0, vì nó là tổng của các phần còn lại, vì vậy chúng ta đi đến kết quả sau

ở đâu SS0, SS1, SS2 lần lượt xác định tổng, hồi quy và tổng dư của các bình phương.

Tổng hồi quy của bình phương đo lường phần phương sai được giải thích bằng mối quan hệ tuyến tính; phần dư - một phần của sự phân tán, không được giải thích bằng sự phụ thuộc tuyến tính.

Mỗi tổng này được đặc trưng bởi một số bậc tự do (HR) tương ứng, xác định số lượng đơn vị dữ liệu độc lập với nhau. Nói cách khác, nhịp tim có liên quan đến số lần quan sát N và số lượng các tham số được tính toán từ tổng các tham số này. Trong trường hợp đang xem xét, để tính toán SS0 chỉ một hằng số (giá trị trung bình) được xác định, do đó nhịp tim cho SS0 sẽ là (N– 1), nhịp tim cho SS 2 - (n - 2) và nhịp tim cho SS 1 sẽ là n - (n - 1) = 1, vì có n - 1 điểm không đổi trong phương trình hồi quy. Cũng giống như tổng bình phương, nhịp tim liên quan đến

Hàm holtwinter trong r thực hiện như thế nào

Tổng bình phương liên quan đến sự phân tích của phương sai, cùng với nhịp tim tương ứng, có thể được đặt trong cái gọi là bảng phân tích phương sai (bảng ANOVA - ANallysis Of VAriance) (Bảng 3.1).

Bảng 3.1

Bảng ANOVA

Nguồn

Tổng bình phương

Hình vuông vừa

hồi quy

SS2/ (n-2)

Sử dụng chữ viết tắt đã giới thiệu cho tổng các hình vuông, chúng tôi xác định hệ số xác định như tỷ lệ của tổng hồi quy của các bình phương với tổng bình phương là

Hàm holtwinter trong r thực hiện như thế nào

(3.13)

Hệ số xác định đo lường tỷ lệ biến thiên của một biến Y, có thể được giải thích bằng cách sử dụng thông tin về sự thay đổi của biến độc lập x. Hệ số xác định thay đổi từ 0 khi X không ảnh hưởng đến Y,đến một khi thay đổi Yđược giải thích đầy đủ bởi sự thay đổi x.

3.8. Mô hình dự báo hồi quy

Dự đoán tốt nhất là dự đoán có phương sai nhỏ nhất. Trong trường hợp của chúng ta, bình phương nhỏ nhất thông thường tạo ra dự đoán tốt nhất trong tất cả các phương pháp đưa ra các ước tính không chệch dựa trên phương trình tuyến tính. Sai số dự báo liên quan đến quy trình dự báo có thể đến từ bốn nguồn.

Đầu tiên, bản chất ngẫu nhiên của các lỗi cộng được xử lý bằng hồi quy tuyến tính đảm bảo rằng dự báo sẽ lệch khỏi các giá trị thực ngay cả khi mô hình được chỉ định chính xác và các tham số của nó được biết chính xác.

Thứ hai, bản thân quá trình ước lượng đưa ra một lỗi trong việc ước lượng các tham số - chúng hiếm khi có thể bằng giá trị thực, mặc dù chúng bằng giá trị trung bình.

Thứ ba, trong trường hợp dự báo có điều kiện (trong trường hợp các giá trị chính xác chưa biết của các biến độc lập), sai số được đưa ra với dự báo của các biến giải thích.

Thứ tư, lỗi có thể xuất hiện do thông số kỹ thuật của mô hình không chính xác.

Do đó, các nguồn lỗi có thể được phân loại như sau:

  1. bản chất của biến số;
  2. bản chất của mô hình;
  3. sai số giới thiệu bởi dự báo của các biến ngẫu nhiên độc lập;
  4. lỗi đặc điểm kỹ thuật.

Chúng tôi sẽ xem xét một dự báo vô điều kiện, khi các biến độc lập được dự đoán dễ dàng và chính xác. Chúng tôi bắt đầu xem xét vấn đề chất lượng dự báo với phương trình hồi quy theo cặp.

Hàm holtwinter trong r thực hiện như thế nào

Câu lệnh bài toán trong trường hợp này có thể được xây dựng như sau: dự báo tốt nhất y T + 1 sẽ là bao nhiêu, với điều kiện là trong mô hình y = a + bx tùy chọn một và bước tính chính xác và giá trị xT + 1- đã biết.

Sau đó, giá trị dự đoán có thể được xác định là

Khi đó, lỗi dự báo sẽ là

Hàm holtwinter trong r thực hiện như thế nào
.

Lỗi dự báo có hai thuộc tính:

Phương sai kết quả là nhỏ nhất trong số tất cả các ước tính có thể dựa trên phương trình tuyến tính.

Mặc du một và b đã biết, lỗi dự báo xuất hiện do lúc T + 1 có thể không nằm trên đường hồi quy do lỗi ε T + 1, tuân theo phân phối chuẩn với phương sai và giá trị trung bình bằng 0 σ2. Để kiểm tra chất lượng của dự báo, chúng tôi giới thiệu giá trị chuẩn hóa

Hàm holtwinter trong r thực hiện như thế nào

Khoảng tin cậy 95% sau đó có thể được xác định như sau:

Hàm holtwinter trong r thực hiện như thế nào

ở đâu β 0,05 là các lượng tử của phân phối chuẩn.

Các ranh giới của khoảng 95% có thể được xác định là

Lưu ý rằng trong trường hợp này chiều rộng mức độ tin cậy không phụ thuộc vào kích thước X, và các ranh giới của khoảng là các đường thẳng song song với các đường hồi quy.

Thông thường, khi xây dựng đường hồi quy và kiểm tra chất lượng của dự báo, cần phải đánh giá không chỉ các tham số hồi quy mà còn cả phương sai của sai số dự báo. Có thể chỉ ra rằng trong trường hợp này, phương sai sai phụ thuộc vào giá trị (), ở đó là giá trị trung bình của biến độc lập. Ngoài ra, chuỗi số càng dài thì dự báo càng chính xác. Sai số dự báo giảm nếu giá trị của X T + 1 gần với giá trị trung bình của biến độc lập và ngược lại, khi di chuyển ra xa giá trị trung bình, dự báo trở nên kém chính xác hơn. Trên hình. 3.6 cho thấy kết quả của dự đoán bằng cách sử dụng phương trình hồi quy tuyến tính cho 6 khoảng thời gian phía trước cùng với khoảng tin cậy.

Hàm holtwinter trong r thực hiện như thế nào

Cơm. 3.6. Dự đoán hồi quy tuyến tính

Như có thể thấy từ hình. 3.6, đường hồi quy này không mô tả tốt dữ liệu ban đầu: có một sự thay đổi lớn so với đường phù hợp. Chất lượng của mô hình cũng có thể được đánh giá bằng các phần dư, với một mô hình đạt yêu cầu, cần được phân phối xấp xỉ theo quy luật thông thường. Trên hình. 3.7 cho thấy một đồ thị của phần dư, được xây dựng bằng cách sử dụng thang xác suất.

Hàm holtwinter trong r thực hiện như thế nào

Hình.3.7. Biểu đồ dư lượng

Khi sử dụng một thang đo như vậy, dữ liệu tuân theo quy luật thông thường phải nằm trên một đường thẳng. Như sau hình vẽ, các điểm ở đầu và cuối thời kỳ quan sát hơi lệch khỏi một đường thẳng, điều này cho thấy chất lượng không đủ cao của mô hình đã chọn ở dạng phương trình hồi quy tuyến tính.

Trong bảng. Bảng 3.2 cho thấy kết quả của dự báo (cột thứ hai) cùng với khoảng tin cậy 95% (cột dưới - thứ ba và trên - thứ tư, tương ứng).

Bảng 3.2

Kết quả dự báo

Hàm holtwinter trong r thực hiện như thế nào

3.9. Mô hình hồi quy đa biến

Trong hồi quy đa biến, dữ liệu cho mỗi trường hợp bao gồm các giá trị của biến phụ thuộc và từng biến độc lập. Biến phụ thuộc y là một biến ngẫu nhiên liên quan đến các biến độc lập theo mối quan hệ sau:

đâu là hệ số hồi quy cần xác định; ε là thành phần lỗi tương ứng với độ lệch của các giá trị của biến phụ thuộc so với tỷ lệ thực (giả định rằng các lỗi là độc lập và có phân phối chuẩn với giá trị trung bình bằng 0 và phương sai chưa biết σ ).

Đối với một tập dữ liệu nhất định, có thể tìm ước tính của các hệ số hồi quy bằng phương pháp bình phương nhỏ nhất. Nếu các ước lượng OLS được biểu thị bằng, thì hàm hồi quy tương ứng sẽ giống như sau:

Phần dư là ước lượng của thành phần sai số và tương tự như phần dư trong trường hợp hồi quy tuyến tính đơn giản.

Phân tích thống kê mô hình hồi quy đa biến được thực hiện tương tự như phân tích hồi quy tuyến tính đơn giản. Các gói tiêu chuẩn của các chương trình thống kê giúp có thể thu được các ước lượng bằng bình phương nhỏ nhất cho các tham số mô hình, ước tính sai số tiêu chuẩn của chúng. Ngoài ra, bạn có thể nhận được giá trị t- thống kê để kiểm tra ý nghĩa của các điều khoản riêng lẻ của mô hình hồi quy và giá trị F- thống kê để kiểm tra ý nghĩa của sự phụ thuộc hồi quy.

Hình thức tách các tổng bình phương trong trường hợp hồi quy đa biến tương tự như biểu thức (3.13), nhưng tỷ lệ cho nhịp tim sẽ như sau

Chúng tôi nhấn mạnh lại rằng N là khối lượng quan sát, và k là số lượng biến trong mô hình. Phương sai tổng thể của biến phụ thuộc bao gồm hai thành phần: phương sai được giải thích bởi các biến độc lập thông qua hàm hồi quy và phương sai không giải thích được.

Bảng ANOVA cho trường hợp hồi quy đa biến sẽ có dạng như trong Bảng. 3.3.

Bảng 3.3

Bảng ANOVA

Nguồn

Tổng bình phương

Hình vuông vừa

hồi quy

SS2/ (n-k-1)

Như một ví dụ về hồi quy đa biến, chúng tôi sẽ sử dụng dữ liệu từ gói Statistica (tệp dữ liệu Nghèo đói.Sta) Dữ liệu được trình bày dựa trên sự so sánh kết quả của các cuộc điều tra dân số năm 1960 và 1970. cho một mẫu ngẫu nhiên của 30 quốc gia. Tên quốc gia đã được nhập dưới dạng tên chuỗi và tên của tất cả các biến trong tệp này được liệt kê bên dưới:

POP_CHNG - sự thay đổi dân số trong những năm 1960-1970;

N_EMPLD - số người làm việc trong nông nghiệp;

PT_POOR - tỷ lệ gia đình sống dưới mức nghèo khổ;

TAX_RATE - thuế suất;

PT_PHONE - phần trăm căn hộ có điện thoại;

PT_RURAL - phần trăm dân số nông thôn;

TUỔI THỌ là tuổi trung niên.

Là một biến phụ thuộc, chúng tôi chọn tính năng Pt_Poor, và độc lập - tất cả phần còn lại. Các hệ số hồi quy được tính toán giữa các biến đã chọn được đưa ra trong Bảng. 3,4

Bảng 3.4

Hệ số hồi quy

Hàm holtwinter trong r thực hiện như thế nào

Bảng này hiển thị các hệ số hồi quy ( TẠI) và hệ số hồi quy chuẩn hóa ( bản beta). Với sự trợ giúp của các hệ số TẠI dạng của phương trình hồi quy được thiết lập, trong đó trường hợp này giống như:

Việc chỉ bao gồm các biến này ở phía bên phải là do chỉ những đặc điểm này mới có giá trị xác suất R nhỏ hơn 0,05 (xem cột thứ tư của Bảng 3.4).

Thư mục

  1. Basovsky L. E. Dự báo và lập kế hoạch trong điều kiện thị trường. - M .: Infra - M, 2003.
  2. Hộp J., Jenkins G. Phân tích chuỗi thời gian. Vấn đề 1. Dự báo và quản lý. - M.: Mir, 1974.
  3. Borovikov V. P., Ivchenko G. I. Dự báo trong hệ thống Thống kê trong môi trường Windows. - M.: Tài chính và thống kê, 1999.
  4. Công tước W. Xử lý dữ liệu trên PC trong các ví dụ. - St.Petersburg: Peter, 1997.
  5. Ivchenko B. P., Martyshchenko L. A., Ivantsov I. B. Thông tin kinh tế vi mô. Phần 1. Phương pháp phân tích và dự báo. - St.Petersburg: Nordmed-Izdat, 1997.
  6. Krichevsky M. L. Giới thiệu về mạng nơron nhân tạo: Proc. phụ cấp. - Xanh Pê-téc-bua: St.Petersburg. trạng thái công nghệ hàng hải. un-t, 1999.
  7. Soshnikova L. A., Tamashevich V. N., Uebe G. et al. Phân tích thống kê đa biến trong kinh tế học. - M.: Unity-Dana, 1999.

Đường trung bình động cho phép bạn làm mịn dữ liệu một cách hoàn hảo. Nhưng nhược điểm chính của nó là mỗi giá trị trong dữ liệu nguồn có cùng trọng số đối với nó. Ví dụ: đối với đường trung bình động sử dụng khoảng thời gian sáu tuần, mỗi giá trị cho mỗi tuần được cho bằng 1/6 trọng số. Đối với một số thống kê được thu thập, các giá trị gần đây hơn sẽ có trọng số hơn. Do đó, làm mịn theo cấp số nhân được sử dụng để cung cấp cho dữ liệu gần đây nhất có trọng lượng hơn. Như vậy, vấn đề thống kê này đã được giải quyết.

Công thức tính toán theo phương pháp làm mịn hàm mũ trong Excel

Hình dưới đây cho thấy báo cáo nhu cầu cho một sản phẩm cụ thể trong 26 tuần. Cột Nhu cầu chứa thông tin về số lượng hàng hóa đã bán. Trong cột "Dự báo" - công thức:

Cột "Trung bình động" xác định nhu cầu dự báo, được tính bằng cách tính thông thường của đường trung bình động với khoảng thời gian 6 tuần:

Hàm holtwinter trong r thực hiện như thế nào

Trong cột cuối cùng "Dự báo", với công thức được mô tả ở trên, phương pháp làm mịn dữ liệu theo cấp số nhân được áp dụng trong đó giá trị của các tuần trước có trọng số lớn hơn các tuần trước.

Hệ số "Alpha:" được nhập vào ô G1, nó có nghĩa là trọng số của phép gán cho dữ liệu gần đây nhất. Trong ví dụ này, nó có giá trị là 30%. 70% trọng lượng còn lại được phân phối cho phần còn lại của dữ liệu. Tức là, giá trị thứ hai về mức độ liên quan (từ phải sang trái) có trọng số bằng 30% của 70% trọng số còn lại - đây là 21%, giá trị thứ ba có trọng số bằng 30% phần còn lại trong số 70% trọng lượng - 14,7%, v.v.



Biểu đồ làm mịn theo cấp số nhân

Hình dưới đây cho thấy biểu đồ nhu cầu, đường trung bình động và dự báo làm mịn theo cấp số nhân, được xây dựng trên cơ sở các giá trị ban đầu:


Hàm holtwinter trong r thực hiện như thế nào

Lưu ý rằng dự báo làm mịn theo cấp số nhân phản ứng nhanh hơn với những thay đổi của nhu cầu so với đường trung bình động.

Dữ liệu cho các tuần trước tiếp theo được nhân với hệ số alpha và kết quả được cộng vào phần còn lại của phần trăm trọng số nhân với giá trị dự đoán trước đó.

Mô hình chuỗi thời gian đơn giản và rõ ràng về mặt logic có dạng sau:

Y t = b + e t

y, = b + rn (11,5)

trong đó b là một hằng số, e là một sai số ngẫu nhiên. Hằng số b tương đối ổn định trong mỗi khoảng thời gian, nhưng cũng có thể thay đổi chậm theo thời gian. Một cách trực quan để trích xuất giá trị của b từ dữ liệu là sử dụng làm mịn đường trung bình động, trong đó các quan sát mới nhất có trọng số hơn các quan sát áp chót, các quan sát áp chót có trọng số cao hơn các quan sát áp chót, v.v. Làm mịn theo cấp số nhân đơn giản chỉ có vậy. Ở đây, trọng số giảm dần theo cấp số nhân được quy cho các quan sát cũ hơn, trong khi, không giống như đường trung bình động, tất cả các quan sát trước đó của chuỗi đều được tính đến, và không chỉ những quan sát rơi vào một cửa sổ nhất định. Công thức chính xác để làm mịn theo cấp số nhân đơn giản là:

S t = a y t + (1 - a) S t -1

Khi áp dụng công thức này một cách đệ quy, mỗi giá trị được làm mịn mới (cũng là một dự đoán) được tính là giá trị trung bình có trọng số của quan sát hiện tại và chuỗi đã làm mịn. Rõ ràng, kết quả của việc làm mịn phụ thuộc vào tham số a . Nếu a là 1, thì các quan sát trước đó hoàn toàn bị bỏ qua. Nếu a là 0, thì các quan sát hiện tại bị bỏ qua. Giá trị của a từ 0 đến 1 cho kết quả trung gian. Các nghiên cứu thực nghiệm đã chỉ ra rằng một phép làm trơn hàm mũ đơn giản thường cho một dự đoán khá chính xác.

Trong thực tế, nó thường được khuyến nghị lấy ít hơn 0,30. Tuy nhiên, việc chọn lớn hơn 0,30 đôi khi cho dự đoán chính xác hơn. Điều này có nghĩa là ước tính giá trị tối ưu của a từ dữ liệu thực vẫn tốt hơn là sử dụng các khuyến nghị chung.

Trong thực tế, tham số làm mịn tối ưu thường được tìm kiếm bằng cách sử dụng quy trình tìm kiếm lưới. Phạm vi có thể có của các giá trị tham số được chia bởi một lưới với một bước nhất định. Ví dụ: hãy xem xét một lưới các giá trị từ a = 0,1 đến a = 0,9 với bước là 0,1. Giá trị của a sau đó được chọn để tổng bình phương (hoặc bình phương trung bình) của các phần dư (giá trị quan sát trừ các dự đoán trước một bước) là nhỏ nhất.

Microsoft Excel cung cấp chức năng Làm trơn theo cấp số nhân, thường được sử dụng để làm mịn các cấp của chuỗi thời gian thực nghiệm dựa trên phương pháp làm trơn hàm mũ đơn giản. Để gọi chức năng này, chọn Tools Þ Data Analysis từ thanh menu. Cửa sổ Phân tích Dữ liệu sẽ mở ra trên màn hình, trong đó bạn nên chọn giá trị Làm mịn theo cấp số nhân (Làm mịn theo cấp số nhân). Kết quả là, hộp thoại Làm mịn theo cấp số nhân sẽ xuất hiện.

Trong hộp thoại Làm mịn theo cấp số nhân, hầu như các tham số tương tự được đặt như trong hộp thoại Trung bình động đã thảo luận ở trên.

1. Phạm vi đầu vào (Dữ liệu đầu vào) - trong trường này, một phạm vi ô chứa các giá trị của tham số đang nghiên cứu được nhập.

2. Nhãn - hộp kiểm này được chọn nếu
hàng (cột) đầu tiên trong phạm vi đầu vào chứa tiêu đề. Nếu thiếu tiêu đề, hộp kiểm sẽ được xóa. Trong trường hợp này, các tên tiêu chuẩn sẽ được tạo tự động cho dữ liệu phạm vi đầu ra.

3. Hệ số làm mờ - nhập giá trị của hệ số làm mịn theo cấp số nhân đã chọn a trong trường này. Giá trị mặc định là a = 0,3.

4. Tùy chọn đầu ra - trong nhóm này, ngoài việc chỉ định phạm vi ô cho dữ liệu đầu ra trong trường Phạm vi đầu ra, bạn cũng có thể yêu cầu tự động vẽ biểu đồ, mà bạn cần kiểm tra tùy chọn Đầu ra biểu đồ và tính toán tiêu chuẩn lỗi mà bạn cần kiểm tra tùy chọn Standard Errog (Lỗi tiêu chuẩn).

Nhiệm vụ 2. Sử dụng chương trình Microsoft Excel, sử dụng chức năng Làm mịn theo hàm mũ, dựa trên dữ liệu về khối lượng đầu ra của Tác vụ 1, tính toán mức đầu ra được làm mịn và lỗi tiêu chuẩn. Sau đó, trình bày dữ liệu thực tế và dự đoán bằng biểu đồ. Gợi ý: bạn sẽ nhận được một bảng và biểu đồ tương tự như bảng đã làm trong nhiệm vụ 1, nhưng với các mức độ làm mịn khác nhau và sai số tiêu chuẩn.

Phương pháp căn chỉnh phân tích

Trong đó các giá trị lý thuyết của chuỗi thời gian được tính theo phương trình phân tích tương ứng tại thời điểm t.

Định nghĩa các giá trị lý thuyết (được tính toán) được thực hiện trên cơ sở của cái gọi là mô hình toán học đầy đủ, cách tốt nhất hiển thị xu hướng chính trong sự phát triển của chuỗi thời gian.

Các mô hình (công thức) đơn giản nhất thể hiện xu hướng phát triển như sau:

Hàm số tuyến tính có đồ thị là một đường thẳng:

Hàm số mũ:

Y t = a 0 * a 1 t

Hàm lũy thừa bậc hai, đồ thị của nó là một parabol:

Y t = a 0 + a 1 * t + a 2 * t 2

Hàm logarit:

Y t = a 0 + a 1 * ln t

Các tham số của hàm thường được tính bằng phương pháp bình phương nhỏ nhất, trong đó điểm nhỏ nhất của tổng bình phương độ lệch giữa mức lý thuyết và thực nghiệm được coi là một nghiệm:

Hàm holtwinter trong r thực hiện như thế nào

trong đó - mức được căn chỉnh (được tính toán) và Yt - mức thực tế.

Tham số phương trình a i thỏa mãn điều kiện này có thể được tìm thấy bằng cách giải hệ phương trình thông thường. Dựa trên phương trình xu hướng tìm được, các mức được căn chỉnh được tính toán.

căn chỉnh đường thẳngđược sử dụng trong trường hợp lợi nhuận tuyệt đối trên thực tế không đổi, tức là khi các mức thay đổi theo cấp số cộng (hoặc gần bằng cấp số cộng).

Căn chỉnh theo hàm mũáp dụng khi chuỗi phản ánh sự phát triển trong nghề hình học, tức là các yếu tố tăng trưởng chuỗi thực tế không đổi.

Căn chỉnh chức năng nguồn(parabol bậc hai) được sử dụng khi chuỗi thời gian thay đổi với tốc độ tăng trưởng chuỗi không đổi.

Thăng bằng hàm logaritđược sử dụng khi chuỗi phản ánh sự phát triển với tốc độ tăng trưởng chậm hơn vào cuối kỳ, tức là khi sự gia tăng các mức cuối cùng của chuỗi thời gian có xu hướng bằng không.

Theo các tham số được tính toán, mô hình xu hướng của hàm được tổng hợp, tức là nhận các giá trị a 0, a 1, a, 2 và thay chúng vào phương trình yêu cầu.

Tính đúng đắn của các phép tính của các mức phân tích có thể được kiểm tra bằng điều kiện sau: tổng các giá trị của chuỗi thực nghiệm phải khớp với tổng các mức đã tính của chuỗi được căn chỉnh. Trong trường hợp này, một lỗi nhỏ trong tính toán có thể xảy ra do làm tròn các giá trị được tính toán:

Để đánh giá độ chính xác của mô hình xu hướng, hệ số xác định được sử dụng:

Hàm holtwinter trong r thực hiện như thế nào

phương sai của dữ liệu lý thuyết thu được từ mô hình xu hướng là phương sai của dữ liệu thực nghiệm.

Mô hình xu hướng phù hợp với quá trình đang nghiên cứu và phản ánh xu hướng phát triển của nó ở các giá trị R 2 gần bằng 1.

Sau khi chọn mô hình phù hợp nhất, bạn có thể đưa ra dự báo cho bất kỳ khoảng thời gian nào. Khi đưa ra dự báo, chúng hoạt động không phải với một điểm, mà với một ước tính khoảng thời gian, xác định cái gọi là khoảng tin cậy của dự báo. Giá trị của khoảng tin cậy được định nghĩa theo các thuật ngữ chung như sau:

Hàm holtwinter trong r thực hiện như thế nào

độ lệch chuẩn so với xu hướng ở đâu; ta- giá trị dạng bảng của kiểm định t của Student ở mức ý nghĩa một, điều này phụ thuộc vào mức ý nghĩa một(%) và số bậc tự do k = n- t. Giá trị - được xác định theo công thức:

Hàm holtwinter trong r thực hiện như thế nào

ở đâu và các giá trị thực tế và được tính toán của các mức của chuỗi động; P - số cấp hàng; t- số lượng tham số trong phương trình xu hướng (đối với phương trình đường thẳng t - 2, đối với phương trình parabol bậc 2 t = 3).

Sau các tính toán cần thiết, một khoảng được xác định trong đó giá trị dự đoán sẽ được định vị với một xác suất nhất định.

Sử dụng Microsoft Excel để xây dựng các mô hình xu hướng khá đơn giản. Đầu tiên, chuỗi thời gian thực nghiệm phải được trình bày dưới dạng biểu đồ thuộc một trong các loại sau: biểu đồ, biểu đồ thanh, biểu đồ, biểu đồ phân tán, biểu đồ vùng, sau đó nhấp chuột phải vào một trong các điểm đánh dấu dữ liệu trên biểu đồ. Do đó, chính chuỗi thời gian sẽ được đánh dấu trên biểu đồ và menu ngữ cảnh sẽ mở ra trên màn hình. Từ menu này, chọn lệnh Thêm đường xu hướng. Hộp thoại Thêm đường xu hướng sẽ được hiển thị.

Trên tab Loại của hộp thoại này, loại xu hướng bắt buộc được chọn:

1. tuyến tính (Linear);

2. logarit (Lôgarit);

3. polynomial, từ bậc 2 đến bậc 6 bao gồm (Polinomial);

4. quyền lực (Power);

5. lũy thừa (Exponential);

6. Đường trung bình động, với chỉ báo về khoảng thời gian làm phẳng từ 2 đến 15 (Đường trung bình động).

Trên tab Tùy chọn của hộp thoại này, các tùy chọn xu hướng bổ sung được đặt.

1. Trendline Name (Tên của đường cong được làm mịn) - trong nhóm này, tên được chọn, tên này sẽ được hiển thị trên biểu đồ để chỉ ra chức năng được sử dụng để làm trơn chuỗi thời gian. Các tùy chọn sau đây có thể thực hiện được:

♦ Tự động - Khi nút radio được đặt ở vị trí này, Microsoft Excel sẽ tự động tạo tên của chức năng làm mịn xu hướng dựa trên loại xu hướng đã chọn, chẳng hạn như Linear (Hàm tuyến tính).

♦ Tùy chỉnh - Khi nút radio được đặt ở vị trí này, bạn có thể nhập tên riêng của mình cho chức năng xu hướng vào ô bên phải, dài tối đa 256 ký tự.

2. Dự báo (Forecast) - trong nhóm này bạn có thể chỉ định bao nhiêu giai đoạn phía trước (trường Chuyển tiếp) bạn muốn chiếu một đường xu hướng vào tương lai và bao nhiêu giai đoạn trở lại (trường Quay lại) bạn muốn chiếu một đường xu hướng vào quá khứ (các trường này không có sẵn trong chế độ trung bình động).

3. Đặt điểm chặn (Điểm chặn đường cong với trục Y tại một điểm) - hộp kiểm tùy chọn này và trường nhập liệu nằm ở bên phải cho phép bạn chỉ định trực tiếp điểm mà tại đó đường xu hướng sẽ giao với trục Y (các trường này không có sẵn cho tất cả các chế độ).

4. Hiển thị phương trình trên biểu đồ - khi tùy chọn này được chọn, một phương trình mô tả đường xu hướng làm mịn sẽ được hiển thị trên biểu đồ.

5. Hiển thị giá trị bình phương R trên biểu đồ R2) - khi hộp kiểm này được chọn, biểu đồ sẽ hiển thị giá trị của hệ số xác định.

Các thanh lỗi cũng có thể được hiển thị cùng với đường xu hướng trên biểu đồ chuỗi thời gian. Để chèn các thanh lỗi, hãy chọn một chuỗi dữ liệu, nhấp chuột phải vào nó và chọn lệnh Định dạng Chuỗi Dữ liệu từ menu ngữ cảnh bật lên. Hộp thoại Định dạng Chuỗi Dữ liệu sẽ mở ra trên màn hình, trong đó bạn sẽ chuyển đến tab Thanh Lỗi Y (Y-error).

Trên tab này, sử dụng công tắc Số lỗi, bạn chọn loại thanh và tùy chọn tính toán chúng, tùy thuộc vào loại lỗi.

1. Giá trị cố định - khi công tắc được đặt ở vị trí này, giá trị không đổi được chỉ định trong trường bộ đếm ở bên phải được lấy làm giá trị lỗi cho phép;

2. Phần trăm (Giá trị tương đối) - khi công tắc được đặt ở vị trí này, độ lệch cho phép được tính cho mỗi điểm dữ liệu, dựa trên giá trị phần trăm được chỉ định trong trường bộ đếm ở bên phải;

3. (Các) độ lệch chuẩn - khi công tắc được đặt ở vị trí này, độ lệch chuẩn được tính cho mỗi điểm dữ liệu, sau đó được nhân với số được chỉ định trong trường bộ đếm ở bên phải (hệ số nhân);

4. Lỗi tiêu chuẩn - khi công tắc được đặt ở vị trí này, giá trị lỗi tiêu chuẩn được giả định, là không đổi đối với tất cả các mục dữ liệu;

5. Custom (Tùy chỉnh) - khi công tắc được đặt ở vị trí này, một mảng giá trị độ lệch tùy ý \ u200b \ u200bis được nhập theo hướng tích cực và / hoặc tiêu cực (bạn có thể nhập liên kết đến một dải ô).

Thanh lỗi cũng có thể được định dạng. Để thực hiện việc này, hãy chọn chúng bằng cách nhấp vào nút chuột phải và chọn lệnh Định dạng thanh lỗi từ trình đơn ngữ cảnh bật lên.

Nhiệm vụ 3. Sử dụng chương trình Microsoft Excel, dựa trên dữ liệu về khối lượng của vấn đề của Nhiệm vụ 1, bạn phải:

Trình bày chuỗi thời gian dưới dạng biểu đồ được xây dựng bằng Trình hướng dẫn Biểu đồ. Sau đó, thêm một đường xu hướng, chọn phiên bản thích hợp nhất của phương trình.

Trình bày kết quả dưới dạng bảng "Lựa chọn phương trình xu hướng":

Bảng "Lựa chọn phương trình xu hướng"

Trình bày phương trình đã chọn bằng đồ thị, vẽ dữ liệu về tên của hàm thu được và giá trị của độ tin cậy gần đúng (R 2).

Nhiệm vụ 4. Trả lời các câu hỏi sau:

1. Khi phân tích xu hướng cho một tập dữ liệu nhất định, hệ số xác định cho mô hình tuyến tính hóa ra là 0,95, cho mô hình logarit - 0,8 và cho đa thức bậc ba - 0,9636. Mô hình xu hướng nào là phù hợp nhất cho quá trình đang nghiên cứu:

a) tuyến tính;

b) lôgarit;

c) đa thức bậc 3.

2. Theo số liệu đã trình bày trong nhiệm vụ 1, hãy dự đoán khối lượng sản phẩm đầu ra năm 2003. Xu hướng chung nào trong hành vi của số lượng được nghiên cứu theo sau từ kết quả dự báo của bạn:

a) có sự suy giảm trong sản xuất;

b) sản xuất vẫn ở mức cũ;

c) có sự gia tăng trong sản xuất.

Trong tài liệu này, các đặc điểm chính của chuỗi thời gian, các mô hình phân rã của chuỗi thời gian, cũng như các phương pháp chính để làm mịn chuỗi - phương pháp trung bình động, làm mịn hàm mũ và căn chỉnh phân tích đã được xem xét. Để giải quyết những vấn đề này, Microsoft Excel cung cấp các công cụ như Đường trung bình động (Moving Average) và Exponential Smoothing (Làm mịn theo cấp số nhân), cho phép bạn làm mượt các mức của chuỗi thời gian thực nghiệm, cũng như lệnh Add Trendiine (Thêm đường xu hướng ), cho phép bạn xây dựng các mô hình xu hướng và đưa ra dự báo dựa trên các giá trị có sẵn của chuỗi thời gian.

P.S. Để bật Gói phân tích dữ liệu, hãy chọn lệnh Công cụ → Phân tích dữ liệu (Tools → Data Analysis).

Nếu Phân tích dữ liệu bị thiếu, thì bạn phải thực hiện các bước sau:

1. Chọn lệnh Công cụ → Bổ trợ (Add-in).

2. Chọn Analysis ToolPak từ danh sách cài đặt được đề xuất, sau đó bấm OK. Sau đó, gói tùy chỉnh Phân tích Dữ liệu sẽ được tải xuống và kết nối với Excel. Lệnh tương ứng sẽ xuất hiện trong menu Công cụ.


© 2015-2019 trang web
Tất cả các quyền thuộc về tác giả của họ. Trang web này không yêu cầu quyền tác giả, nhưng cung cấp quyền sử dụng miễn phí.
Ngày tạo trang: 2016-04-27

Rõ ràng, trong phương pháp trung bình động có trọng số, có nhiều cách để thiết lập các trọng số sao cho tổng của chúng bằng 1. Một trong những phương pháp này được gọi là làm trơn hàm mũ. Trong lược đồ của phương pháp bình quân gia quyền này, với bất kỳ t> 1 nào, giá trị dự báo tại thời điểm t + 1 là tổng có trọng số của doanh số bán hàng thực tế, trong khoảng thời gian t và doanh số bán hàng dự báo, trong khoảng thời gian t Trong khác từ ngữ,

Làm trơn theo cấp số nhân có lợi thế về tính toán so với đường trung bình động. Ở đây, để tính toán, chỉ cần biết các giá trị của, và, (cùng với giá trị của α). Ví dụ: nếu một công ty cần dự báo nhu cầu đối với 5.000 mặt hàng trong mỗi khoảng thời gian, thì công ty đó sẽ cần lưu trữ 10.001 giá trị dữ liệu (giá trị 5.000, giá trị 5.000 và giá trị α), trong khi để đưa ra dự báo dựa trên trung bình động của 8 nút yêu cầu 40.000 giá trị dữ liệu. Tùy thuộc vào hành vi của dữ liệu, có thể cần lưu trữ các giá trị khác nhau của α cho mỗi sản phẩm, nhưng ngay cả trong trường hợp này, lượng thông tin được lưu trữ ít hơn nhiều so với khi sử dụng đường trung bình. Ưu điểm của việc làm mịn theo cấp số nhân là bằng cách giữ nguyên α và dự đoán cuối cùng, tất cả các dự đoán trước đó cũng được bảo toàn một cách ngầm định.

Chúng ta hãy xem xét một số thuộc tính của mô hình làm mịn hàm mũ. Để bắt đầu, chúng ta lưu ý rằng nếu t> 2, thì trong công thức (1) t có thể được thay thế bằng t – 1, tức là Thay biểu thức này vào công thức ban đầu (1), chúng ta thu được

Thực hiện liên tiếp các lần thay thế tương tự, chúng tôi thu được biểu hiện sau vì

Vì từ bất đẳng thức 0< α < 1 следует, что 0 < 1 – α < 1, то Другими словами, наблюдение , имеет больший вес, чем наблюдение , которое, в свою очередь, имеет больший вес, чем . Это иллюстрирует основное свойство модели экспоненциального сглаживания - коэффициенты при убывают при уменьшении номера k. Также можно показать, что сумма всех коэффициентов (включая коэффициент при ), равна 1.

Có thể thấy từ công thức (2) rằng giá trị là tổng trọng số của tất cả các quan sát trước đó (bao gồm cả quan sát cuối cùng). Số hạng cuối cùng của tổng (2) không phải là quan sát thống kê, nhưng bằng "giả định" (ví dụ, chúng ta có thể giả định rằng). Rõ ràng, với việc tăng t, ảnh hưởng đến dự báo càng giảm, và tại một thời điểm nhất định, nó có thể bị bỏ qua. Ngay cả khi giá trị của α đủ nhỏ (sao cho (1 - α) xấp xỉ bằng 1), giá trị sẽ giảm nhanh chóng.

Giá trị của tham số α ảnh hưởng lớn đến hiệu suất của mô hình dự đoán, vì α là trọng số của lần quan sát gần đây nhất. Điều này có nghĩa là người ta nên chỉ định giá trị lớn hơnα trong trường hợp khi mô hình tiên đoán nhất là lần quan sát cuối cùng. Nếu α gần bằng 0, điều này có nghĩa là gần như hoàn toàn tin tưởng vào dự báo trước đó và bỏ qua quan sát cuối cùng.

Victor có một vấn đề: làm thế nào tốt nhất để chọn giá trị của α. Một lần nữa, công cụ Solver sẽ giúp bạn điều này. Để tìm giá trị tối ưu của α (tức là giá trị mà tại đó đường cong dự đoán sẽ lệch ít nhất so với đường cong giá trị chuỗi thời gian), hãy làm như sau.

  1. Chọn lệnh Công cụ -> Tìm kiếm giải pháp.
  2. Trong hộp thoại Tìm Giải pháp mở ra, hãy đặt ô đích thành G16 (xem trang Expo) và chỉ định rằng giá trị của nó phải là giá trị nhỏ nhất.
  3. Chỉ định rằng ô cần sửa đổi là ô B1.
  4. Nhập các ràng buộc B1> 0 và B1< 1
  5. Bằng cách nhấp vào nút Run, bạn sẽ nhận được kết quả như trong Hình. tám.

Hàm holtwinter trong r thực hiện như thế nào

Một lần nữa, như trong phương pháp trung bình động có trọng số, dự đoán tốt nhất sẽ thu được bằng cách gán trọng số đầy đủ cho lần quan sát cuối cùng. Do đó, giá trị tối ưu của α là 1, với độ lệch tuyệt đối trung bình là 6,82 (ô G16). Victor đã nhận được một dự báo mà anh ấy đã thấy trước đó.

Phương pháp làm trơn theo cấp số nhân hoạt động tốt trong các tình huống mà biến mà chúng ta quan tâm đến hoạt động cố định và độ lệch của nó so với một giá trị không đổi là do các yếu tố ngẫu nhiên và không thường xuyên gây ra. Nhưng: bất kể giá trị của tham số α là bao nhiêu, phương pháp làm trơn hàm mũ sẽ không thể dự đoán dữ liệu tăng hoặc giảm đơn điệu (giá trị dự đoán sẽ luôn nhỏ hơn hoặc nhiều hơn giá trị quan sát được). Nó cũng có thể được chỉ ra rằng trong một mô hình có sự thay đổi theo mùa, sẽ không thể có được các dự báo thỏa đáng bằng phương pháp này.

Nếu số liệu thống kê thay đổi đơn điệu hoặc có thể thay đổi theo mùa, phương pháp đặc biệt dự đoán, sẽ được thảo luận bên dưới.

Phương pháp Holt (làm mịn theo cấp số nhân với một xu hướng)

Hàm holtwinter trong r thực hiện như thế nào
,

Phương pháp của Holt cho phép dự báo trong k khoảng thời gian phía trước. Như bạn thấy, phương pháp này sử dụng hai tham số α và β. Giá trị của các tham số này nằm trong khoảng từ 0 đến 1. Biến L, cho biết mức giá trị lâu dài hoặc giá trị cơ bản của dữ liệu chuỗi thời gian. Biến T cho biết khả năng tăng hoặc giảm giá trị trong một khoảng thời gian.

Hãy xem xét công việc của phương pháp này trên một ví dụ mới. Svetlana làm việc với tư cách là nhà phân tích của một công ty môi giới lớn. Dựa trên các báo cáo hàng quý mà cô ấy có cho Startup Airlines, cô ấy muốn dự báo thu nhập của công ty đó trong quý tiếp theo. Dữ liệu có sẵn và sơ đồ được xây dựng trên cơ sở của chúng nằm trong sổ làm việc Startup.xls (Hình 9). Có thể thấy dữ liệu có xu hướng rõ ràng (tăng gần như đơn điệu). Svetlana muốn sử dụng phương pháp Holt để dự đoán thu nhập trên mỗi cổ phiếu trong quý 13. Để làm điều này, bạn phải đặt các giá trị ban đầu cho L và T. Có một số lựa chọn: 1) L bằng giá trị thu nhập trên mỗi cổ phiếu trong quý đầu tiên và T = 0; 2) L bằng giá trị trung bình của thu nhập trên mỗi cổ phiếu trong 12 quý và T bằng mức thay đổi trung bình trong cả 12 quý. Có những lựa chọn khác giá trị ban đầu cho L và T, nhưng Svetlana đã chọn tùy chọn đầu tiên.

Cô quyết định sử dụng công cụ Tìm Giải pháp để tìm giá trị tối ưu của các tham số α và β, tại đó giá trị của giá trị trung bình là lỗi tuyệt đối tỷ lệ phần trăm sẽ là tối thiểu. Để làm điều này, bạn cần làm theo các bước sau.

Chọn lệnh Service -> Tìm kiếm giải pháp.

Trong hộp thoại Tìm kiếm giải pháp mở ra, hãy đặt ô F18 làm ô đích và cho biết rằng giá trị của nó nên được giảm thiểu.

Trong trường Thay đổi ô, hãy nhập phạm vi ô B1: B2. Thêm các ràng buộc B1: B2> 0 và B1: B2< 1.

Bấm vào nút Execute.

Dự báo kết quả được hiển thị trong hình. mười.

Như có thể thấy, các giá trị tối ưu hóa ra là α = 0,59 và β = 0,42, trong khi sai số tuyệt đối trung bình tính theo phần trăm là 38%.

Hàm holtwinter trong r thực hiện như thế nào

Hàm holtwinter trong r thực hiện như thế nào

Hàm holtwinter trong r thực hiện như thế nào

Kế toán thay đổi theo mùa

Các thay đổi theo mùa cần được tính đến khi dự báo từ dữ liệu chuỗi thời gian Các thay đổi theo mùa là các biến động lên xuống với chu kỳ không đổi trong các giá trị của một biến.

Ví dụ: nếu bạn xem doanh số bán kem theo tháng, bạn có thể thấy trong những tháng ấm áp(Tháng 6 đến tháng 8 ở Bắc bán cầu) qua cấp độ cao doanh số bán hàng nhiều hơn trong mùa đông, và như vậy hàng năm. Ở đây biến động theo mùa có khoảng thời gian là 12 tháng. Nếu dữ liệu hàng tuần được sử dụng, mô hình biến động theo mùa sẽ lặp lại sau mỗi 52 tuần Một ví dụ khác phân tích các báo cáo hàng tuần về số lượng khách đã ở lại qua đêm trong một khách sạn nằm ở trung tâm thương mại của thành phố. Có lẽ, chúng ta có thể nói rằng con số lớn khách hàng dự kiến ​​vào tối thứ 3, thứ 4 và thứ 5, lượng khách ít nhất vào tối thứ 7 và chủ nhật, lượng khách trung bình dự kiến ​​vào tối thứ 6 và thứ 2. Cấu trúc dữ liệu như vậy hiển thị số lượng khách hàng trong những ngày khác nhau tuần, sẽ được lặp lại sau mỗi bảy ngày.

Quy trình đưa ra dự báo được điều chỉnh theo mùa bao gồm bốn bước sau:

1) Dựa trên các số liệu ban đầu, cơ cấu của các biến động theo mùa và thời kỳ của các biến động này được xác định.

3) Dựa trên dữ liệu, từ đó loại trừ thành phần mùa vụ, đưa ra dự báo tốt nhất có thể.

4) Thành phần theo mùa được thêm vào dự báo đã nhận.

Hãy minh họa cách tiếp cận này với dữ liệu bán than (tính bằng hàng nghìn tấn) ở Mỹ trong 9 năm làm quản lý tại Mỏ than Gillette, Frank cần dự báo nhu cầu than trong hai quý tới. Ông đã nhập dữ liệu của toàn ngành than vào sổ làm việc Coal.xls và vẽ biểu đồ dữ liệu (Hình 11). Biểu đồ cho thấy khối lượng bán hàng cao hơn mức trung bình trong quý đầu tiên và quý thứ tư ( thời điểm vào Đông năm) và dưới mức trung bình trong quý II và quý III (các tháng xuân hè).

Hàm holtwinter trong r thực hiện như thế nào

Loại trừ thành phần theo mùa

Trước tiên, bạn cần tính giá trị trung bình của tất cả các độ lệch trong một khoảng thời gian thay đổi theo mùa. Để loại trừ thành phần theo mùa trong vòng một năm, dữ liệu cho bốn giai đoạn (quý) được sử dụng. Và để loại trừ thành phần theo mùa khỏi toàn bộ chuỗi thời gian, một chuỗi các đường trung bình động qua các nút T được tính toán, trong đó T là khoảng thời gian dao động theo mùa. Để thực hiện các phép tính cần thiết, Frank đã sử dụng cột C và D, như trong Hình. phía dưới. Cột C chứa đường trung bình động 4 nút dựa trên dữ liệu trong cột B.

Bây giờ chúng ta cần gán các giá trị trung bình động kết quả cho các điểm giữa của chuỗi dữ liệu mà từ đó các giá trị này được tính toán. Thao tác này được gọi là định tâm các giá trị. Nếu T là số lẻ, thì giá trị đầu tiên của đường trung bình động (giá trị trung bình của các giá trị từ giá trị đầu tiên đến Điểm T) nên được gán (T + 1) / 2 cho điểm (ví dụ: nếu T = 7, thì đường trung bình động đầu tiên sẽ được gán cho điểm thứ tư). Tương tự, giá trị trung bình của các giá trị từ điểm thứ hai đến (T + 1) có tâm tại điểm (T + 3) / 2, v.v. Tâm của khoảng thứ n là tại điểm (T + (2n-1)) / 2.

Hàm holtwinter trong r thực hiện như thế nào
Hàm holtwinter trong r thực hiện như thế nào

Nếu T là chẵn, như trong trường hợp đang xét, thì vấn đề trở nên phức tạp hơn một chút, vì ở đây các điểm trung tâm (giữa) nằm giữa các điểm mà giá trị trung bình động được tính toán. Do đó, giá trị căn giữa của điểm thứ ba được tính là giá trị trung bình của giá trị thứ nhất và thứ hai của đường trung bình. Ví dụ, số đầu tiên trong cột D của ý nghĩa được căn giữa trong Hình. 12, bên trái là (1613 + 1594) / 2 = 1603. Trong hình. 13 hiển thị các lô dữ liệu thô và trung bình ở giữa.

Hàm holtwinter trong r thực hiện như thế nào

Tiếp theo, chúng tôi tìm tỷ lệ giữa các giá trị của điểm dữ liệu với các giá trị tương ứng của phương tiện được căn giữa. Vì các điểm ở đầu và cuối của chuỗi dữ liệu không có phương tiện căn giữa tương ứng (xem phần đầu tiên và giá trị mới nhất trong cột D), hành động này không áp dụng cho những điểm này. Các tỷ lệ này cho biết mức độ mà các giá trị dữ liệu lệch khỏi mức điển hình được xác định bởi phương tiện ở giữa. Lưu ý rằng giá trị tỷ lệ cho phần tư thứ ba nhỏ hơn 1 và giá trị tỷ lệ cho phần tư thứ tư lớn hơn 1.

Hàm holtwinter trong r thực hiện như thế nào
Hàm holtwinter trong r thực hiện như thế nào

Các mối quan hệ này là cơ sở để tạo ra các chỉ số theo mùa. Để tính toán chúng, các tỷ lệ được tính toán được nhóm lại theo phần tư, như thể hiện trong Hình. 15 trong các cột G-O.

Sau đó, giá trị trung bình của các tỷ lệ cho mỗi phần tư được tìm thấy (cột E trong Hình 15). Ví dụ: trung bình của tất cả các tỷ số trong quý đầu tiên là 1.108. Giá trị này là chỉ số thời vụ của quý đầu tiên, từ đó có thể kết luận rằng sản lượng than bán ra của quý đầu tiên trung bình bằng khoảng 110,8% tổng lượng than bán ra bình quân hàng năm.

Chỉ số theo mùa là tỷ lệ trung bình của dữ liệu liên quan đến một phần (trong trường hợp này, mùa là một phần tư) với tất cả dữ liệu. Nếu một chỉ số theo mùa lớn hơn 1 có nghĩa là hiệu suất của mùa này cao hơn mức trung bình trong năm, tương tự, nếu chỉ số theo mùa dưới 1, thì hiệu suất của mùa dưới mức trung bình trong năm.

Cuối cùng, để loại trừ thành phần theo mùa khỏi dữ liệu gốc, các giá trị của dữ liệu gốc phải được chia cho chỉ số theo mùa tương ứng. Kết quả của hoạt động này được hiển thị trong cột F và G (Hình 16). Biểu đồ dữ liệu không còn chứa thành phần theo mùa được hiển thị trong Hình. 17.

Hàm holtwinter trong r thực hiện như thế nào
Hàm holtwinter trong r thực hiện như thế nào

Hàm holtwinter trong r thực hiện như thế nào

Dự báo

Dựa trên dữ liệu, từ đó thành phần mùa vụ được loại trừ, một dự báo được xây dựng. Để làm điều này, một phương pháp thích hợp được sử dụng có tính đến bản chất của hành vi của dữ liệu (ví dụ: dữ liệu có xu hướng hoặc tương đối không đổi). Trong ví dụ này, dự báo được thực hiện bằng cách làm trơn đơn giản theo cấp số nhân. Giá trị tối ưu của tham số α được tìm thấy bằng cách sử dụng công cụ Solver. Biểu đồ của dự báo và dữ liệu thực với thành phần mùa vụ bị loại trừ được hiển thị trong hình. mười tám.

Hàm holtwinter trong r thực hiện như thế nào

Kế toán cơ cấu mùa vụ

Bây giờ chúng ta cần tính đến thành phần mùa trong dự báo (1726,5). Để thực hiện điều này, hãy nhân 1726 với chỉ số theo mùa của quý đầu tiên là 1.108, thu được giá trị là 1912. Một phép toán tương tự (nhân 1726 với chỉ số theo mùa với 0,784) sẽ đưa ra dự báo cho quý thứ hai bằng 1353. Kết quả của việc thêm cấu trúc theo mùa vào dự báo kết quả được thể hiện trong Hình. mười chín.

Hàm holtwinter trong r thực hiện như thế nào

Tùy chọn tác vụ:

Nhiệm vụ 1

Đưa ra một chuỗi thời gian

tx

1. Vẽ đồ thị sự phụ thuộc x = x (t).

  1. Sử dụng đường trung bình động đơn giản trên 4 nút, dự đoán nhu cầu tại thời điểm thứ 11.
  2. Phương pháp dự báo này có phù hợp với dữ liệu này hay không? Tại sao?
  3. Nhặt lên hàm tuyến tính xấp xỉ dữ liệu theo phương pháp bình phương nhỏ nhất.

Nhiệm vụ 2

Sử dụng Mô hình dự báo doanh thu của các hãng hàng không khởi nghiệp (Startup.xls), hãy thực hiện như sau:

Nhiệm vụ 3

Đối với chuỗi thời gian

tx

chạy:

  1. Sử dụng đường trung bình động có trọng số trên 4 nút và ấn định các trọng số 4/10, 3/10, 2/10, 1/10, dự đoán nhu cầu tại thời điểm thứ 11. Trọng lượng nhiều hơn nên được chỉ định cho các quan sát gần đây hơn.
  2. Sự gần đúng này có tốt hơn đường trung bình động đơn giản trên 4 nút không? Tại sao?
  3. Tìm giá trị trung bình của độ lệch tuyệt đối.
  4. Sử dụng công cụ Solver để tìm trọng số nút tối ưu. Sai số xấp xỉ đã giảm bao nhiêu?
  5. Sử dụng làm mịn theo cấp số nhân để dự đoán. Phương pháp nào được sử dụng cho kết quả tốt nhất?

Nhiệm vụ 4

Phân tích chuỗi thời gian

Thời gianYêu cầu
  1. Sử dụng đường trung bình động có trọng số 4 nút với các trọng số 4/10, 3/10, 2/10, 1/10 để nhận dự báo tại các thời điểm 5-13. Trọng lượng nhiều hơn nên được chỉ định cho các quan sát gần đây hơn.
  2. Tìm giá trị trung bình của độ lệch tuyệt đối.
  3. Bạn có nghĩ rằng sự gần đúng này tốt hơn mô hình đường trung bình động đơn giản 4 nút không? Tại sao?
  4. Sử dụng công cụ Solver để tìm trọng số nút tối ưu. Bạn đã quản lý bao nhiêu để giảm giá trị lỗi?
  5. Sử dụng làm mịn theo cấp số nhân để dự đoán. Phương pháp nào được sử dụng cho kết quả tốt nhất?

Nhiệm vụ 5

Đưa ra một chuỗi thời gian

Nhiệm vụ 7

Giám đốc tiếp thị của một công ty nhỏ đang phát triển có chuỗi cửa hàng tạp hóa có thông tin về doanh số bán hàng trong toàn bộ thời gian tồn tại của cửa hàng sinh lời cao nhất (xem bảng).

Sử dụng đường trung bình động đơn giản trên 3 nút, dự đoán giá trị tại các nút từ 4 đến 11.

Sử dụng đường trung bình động có trọng số trên 3 nút, dự đoán giá trị tại các nút từ 4 đến 11. Sử dụng công cụ Bộ giải để xác định trọng số tối ưu.

Sử dụng làm trơn theo cấp số nhân để dự đoán các giá trị tại các nút 2-11. Xác định giá trị tối ưu của tham số α bằng công cụ Solver.

Dự báo nào thu được là chính xác nhất và tại sao?

Nhiệm vụ 8

Đưa ra một chuỗi thời gian

  1. Lập kế hoạch cho chuỗi thời gian này. Nối các điểm bằng các đoạn thẳng.
  2. Sử dụng đường trung bình động đơn giản trên 4 nút, dự đoán nhu cầu cho các nút 5-13.
  3. Tìm giá trị trung bình của độ lệch tuyệt đối.
  4. Có nên sử dụng không phương pháp này dự đoán cho dữ liệu được trình bày?
  5. Sự gần đúng này có tốt hơn đường trung bình động đơn giản trên 3 nút không? Tại sao?
  6. Vẽ đồ thị xu hướng tuyến tính và bậc hai từ dữ liệu.
  7. Sử dụng làm mịn theo cấp số nhân để dự đoán. Phương pháp nào được sử dụng cho kết quả tốt nhất?

Nhiệm vụ 10

Sổ làm việc Business_Week.xls hiển thị dữ liệu từ Tuần lễ Kinh doanh cho 43 tháng bán xe hàng tháng.

  1. Xóa thành phần theo mùa khỏi dữ liệu này.
  2. Quyết tâm phương pháp tốt nhất dự báo cho các dữ liệu có sẵn.
  3. Dự báo thời tiết thứ 44 là gì?

Nhiệm vụ 11

  1. mạch đơn giản dự báo, khi giá trị của tuần trước được lấy làm dự báo cho tuần tiếp theo.
  2. Phương pháp trung bình động (với số lượng nút bạn chọn). Cố gắng sử dụng một số những nghĩa khác nhauđiểm giao.

Nhiệm vụ 12

Sổ làm việc Bank.xls hiển thị hiệu suất của ngân hàng. Coi như các phương pháp sau dự đoán các giá trị của chuỗi thời gian này.

Theo dự báo, giá trị trung bình của chỉ báo cho tất cả các tuần trước đó sẽ được sử dụng.

Phương pháp trung bình động có trọng số (với số lượng nút bạn chọn). Hãy thử sử dụng một số giá trị nút khác nhau. Sử dụng công cụ Solver để xác định trọng số tối ưu.

Phương pháp làm trơn hàm mũ. Tìm giá trị tối ưu của tham số α bằng công cụ Solver.

Bạn sẽ đề xuất phương pháp dự báo nào trong số các phương pháp dự báo được đề xuất ở trên để dự đoán các giá trị của chuỗi thời gian này?