Theo Journal of Ambient Intelligence and Humanized Computing, các nhà khoa học ở Đại học khoa học và công nghệ quốc gia, Nga, đã phát triển một mô hình toán học có thể dự đoán vị trí kỳ nghỉ tiếp theo của một người, dựa trên các tweet hiện tại của anh ta trên Twitter. Thuật toán này có khả năng hữu ích cho các doanh nghiệp du lịch, vì giúp dự đoán nhu cầu về các khu nghỉ mát trong các kỳ nghỉ.
Mạng xã hội là một phần không thể thiếu trong cuộc sống của một số lượng lớn người: mỗi ngày họ xuất bản, chia sẻ ảnh và địa điểm và tham gia thảo luận. Các nhà khoa học Nga đã tìm ra cách dự đoán vị trí kỳ nghỉ tiếp theo của người dùng mạng xã hội Twitter dựa trên các tweet với định vị địa lý đính kèm.
Thuật toán dựa trên phương pháp học máy (ML) và phân tích Dữ liệu lớn (Big Data). Các nhà khoa học đã sử dụng không chỉ sử dụng dữ liệu mở về du lịch mà còn về tính cách của chính khách du lịch. Đầu tiên, họ trích xuất tất cả các tweet được gắn thẻ địa lý (tweet có thông tin vị trí) từ dữ liệu và phân loại.
Marina Nezhurina, giám đốc Viện hệ thống kinh doanh thông tin giải thích rằng các nhà khoa học đã sử dụng hơn 800.000 tweet đã được đăng từ một bộ ngẫu nhiên 5.000 hồ sơ người dùng từ các quốc gia châu Âu khác nhau (Pháp, Đức, Thụy Điển, Tây Ban Nha, Ý, Thụy Sĩ, Ba Lan, Hy Lạp và nhiều nước khác). Khi chọn dữ liệu, các danh mục được truy cập nhiều nhất trong các chuyến đi là Thực phẩm, Câu lạc bộ đêm, Nhà ga, Nhà thờ, Bãi biển. Đối với mỗi danh mục, các nhà khoa học đều lập một bộ dữ liệu riêng biệt. Khi chọn dữ liệu, các danh mục được so sánh với các đặc điểm tính cách của người dùng.
Để lập mô hình dự báo, phương pháp phân loại đồng bộ đã được sử dụng, kết hợp các kết quả của tất cả các phân loại cơ bản. Một phương pháp tương tự trước đây đã được thử nghiệm trong nghiên cứu đánh giá các dịch vụ trên tàu cao tốc ở Ấn Độ.
Theo các nhà khoa học, dự báo có thể được cụ thể hóa hơn nữa, muốn vậy, cần phải thu thập các thông số như quốc tịch, tuổi và giới tính của người dùng. Giai đoạn tiếp theo là phân tích và xây dựng các mô hình bằng cách sử dụng một nhóm các phương pháp học máy.
Vũ Trung Hương