Khi dữ liệu không mang lại hiệu quả: Xem xét lại quá trình dữ liệu hóa trong giáo dục đại học toàn cầu

Janja Komljenovic

Janja Komljenovic là Giảng viên cao cấp tại Đại học Edinburgh, Vương quốc Anh. E-mail: j.komljenovic@ed.ac.uk. 

Bài viết dựa trên báo cáo năm 2024 từ Trung tâm Giáo dục Đại học Quốc tế: “Edtech trong Giáo dục Đại học: Phát hiện thực nghiệm từ Dự án Các trường đại học và Kỳ lân: Xây dựng Tài sản Kỹ thuật số trong ngành Giáo dục Đại học”.

Trong giáo dục đại học, dữ liệu số được coi là có tính biến đổi và mọi người đều tin tưởng vào giá trị của nó. Tuy nhiên, dữ liệu số không có giá trị cố hữu. Thay vào đó, nó cần được xử lý để biến thành như vậy. Bài viết này nghiên cứu năm thách thức của quá trình dữ liệu hóa trong lĩnh vực này, giải quyết những quan niệm sai lầm phổ biến. Bài viết ủng hộ việc đổi mới dữ liệu chậm và có trách nhiệm để đáp ứng nhu cầu phát triển của lĩnh vực này.

Dữ liệu số được coi là có giá trị trong nền kinh tế và xã hội đương đại. Trong giáo dục đại học, các bên liên quan tin rằng việc thu thập, phân tích, cấu trúc, quản lý và sử dụng dữ liệu và đầu ra dữ liệu – chẳng hạn như phân tích, bảng thông tin hoặc điểm số – sẽ cải thiện lĩnh vực này. Các trường đại học đặt mục tiêu làm cho dữ liệu hữu ích và phấn đấu trở thành các tổ chức lấy dữ liệu làm động lực trong các hoạt động chiến lược và hoạt động sẵn sàng thực hiện của mình. Các công ty công nghệ giáo dục (EdTech) phấn đấu kiếm tiền từ dữ liệu số mà họ thu thập, tức là làm cho dữ liệu có giá trị về mặt kinh tế. Các nhà hoạch định chính sách tìm cách đưa ra quyết định dựa trên dữ liệu thời gian thực. Tuy nhiên, có nhiều quan niệm sai lầm và thách thức trong việc hiện thực hóa những tưởng tượng về giá trị dữ liệu trong giáo dục đại học. 

Trong bài viết này, năm thách thức của quá trình dữ liệu hóa giáo dục đại học được xác định khi điều tra các trường đại học, công ty khởi nghiệp EdTech và các nhà đầu tư vào EdTech tại Vương quốc Anh. Dữ liệu hóa đề cập đến việc định lượng thế giới xã hội và tự nhiên và biểu diễn chúng ở định dạng kỹ thuật số có thể đọc được bằng máy, thường liên quan đến việc giảm độ phức tạp. Những phát hiện này có khả năng áp dụng ngoài Vương quốc Anh, vì các công ty và nhà đầu tư EdTech được điều tra hoạt động ở nhiều quốc gia và khu vực trên toàn cầu.

Dữ liệu không có giá trị cố hữu

Có vẻ như có một niềm tin nhất quán và phổ biến về giá trị dữ liệu trên khắp các trường đại học, công ty EdTech và các nhà đầu tư vào EdTech. Tuy nhiên, giá trị này không thực sự được hiện thực hóa, ít nhất là không theo mức độ mà các bên liên quan mong muốn. Giá trị dữ liệu có ý nghĩa khác nhau đối với các bên liên quan khác nhau. Một mặt, các trường đại học quan tâm đến việc sử dụng giá trị của dữ liệu để nâng cao trải nghiệm của sinh viên và hiệu quả của các quy trình quản lý, để cá nhân hóa việc học và tự động hóa các quy trình. Mặt khác, các công ty EdTech thử nghiệm các chiến lược khác nhau để kiếm tiền từ dữ liệu của sinh viên và nhân viên mà họ thu thập. Trong cả hai trường hợp, việc biến dữ liệu trở nên hữu ích và có giá trị đều khó khăn và đòi hỏi nhiều nguồn lực. Dữ liệu không có giá trị cố hữu; thay vào đó, dữ liệu phải được biến thành như vậy.

Thực hành dữ liệu tốt rất tốn kém

Xử lý dữ liệu đòi hỏi nguồn lực công nghệ, tài chính và nhân sự. Theo quan điểm của các trường đại học, diễn ngôn dữ liệu hứa hẹn hiệu quả và tiết kiệm, nhưng nghiên cứu chỉ ra rằng cần rất nhiều lao động để hỗ trợ dữ liệu hóa. Đội ngũ này bao gồm nhân viên học thuật và hành chính nhập và sắp xếp dữ liệu, thử nghiệm và điều chỉnh dữ liệu đầu ra, thay đổi thực hành làm việc, v.v… Nó cũng bao gồm nhu cầu về các kỹ năng và công việc mới, chẳng hạn như nhà khoa học dữ liệu, nhà phát triển CNTT, quản lý dự án và quản lý nhà cung cấp, vốn là những công việc đòi hỏi phải thay đổi tổ chức. Chi phí cho cơ sở hạ tầng kỹ thuật số đang tăng lên, bao gồm cả việc chuyển sang cơ sở hạ tầng đám mây Big Tech. Tương tự như vậy, các công ty EdTech phải vật lộn với chi phí thực hành dữ liệu, đặc biệt là các phân tích dữ liệu và đầu ra phức tạp hơn ngoài thống kê mô tả hoặc so sánh đơn giản. Hơn nữa, nếu họ muốn phát triển thông tin chi tiết về dữ liệu liên tổ chức, phải mất khoảng 5 năm để phát triển các cơ sở dữ liệu lớn. Họ phải vật lộn để thu hút đủ đầu tư cho các quy trình dữ liệu chất lượng cao, vì lợi tức đầu tư được cho là thấp hơn trong giáo dục so với các lĩnh vực khác.

Không phải mọi dữ liệu đều hữu ích

Không phải mọi dữ liệu đầu ra đều có tính chất giống nhau. Nhiều trường đại học thấy rằng một số dữ liệu đầu ra được phát hành trong các sản phẩm EdTech không cần thiết cho việc giảng dạy và học tập. Hơn nữa, một số dữ liệu đầu ra không đại diện cho những gì chúng tuyên bố đại diện. Ngoài ra, không cần cùng một số liệu để hỗ trợ việc giảng dạy trực tuyến hoặc tại trường, nhưng thường có cảm giác rằng các công ty EdTech quảng bá dữ liệu đầu ra tương tự nhau. Các trường đại học cho biết rằng “chỉ vì dữ liệu có thể được thu thập và phân tích, không có nghĩa là nó phải như vậy”. Thật vậy, các công ty EdTech thường thử nghiệm với dữ liệu đầu ra để tìm đúng người nhận sẵn sàng trả tiền cho dữ liệu đó. Các dữ liệu đầu ra và số liệu khác nhau có thể được phát triển và quảng bá cho nhiều bên khác nhau, điều này có thể gây bất lợi cho các bên khác. Ví dụ, một số liệu cho thấy có bao nhiêu sinh viên đã truy cập vào bài đọc được giao và họ dành bao nhiêu thời gian cho bài đọc đó có thể được quảng bá như một thước đo hiệu suất của đội ngũ nhân viên học thuật cho các nhà lãnh đạo trường đại học. Nhưng liệu việc sinh viên truy cập vào văn bản điện tử có thực sự là thước đo hiệu suất của đội ngũ nhân viên hay không lại là một câu hỏi khác.

Đầu ra dữ liệu có hậu quả

Cách phổ biến nhất mà các công ty EdTech cố gắng kiếm tiền từ dữ liệu người dùng là bằng cách “dữ liệu hóa sản phẩm”, tức là tích hợp đầu ra dữ liệu vào các sản phẩm có dịch vụ chính khác. Ví dụ: Nền tảng cuộc gọi video có thể tích hợp phân tích mô tả cuộc gọi hoặc mức độ tương tác của người tham gia vào cuộc thảo luận trong cuộc gọi. Như đã đề cập trước đó, có thể tạo ra các đầu ra dữ liệu và số liệu khác nhau cho các đối tượng khác nhau, bao gồm các tác nhân ngoài trường đại học, chẳng hạn như nhà xuất bản (ví dụ: tiêu đề nào được đọc, ở mức độ nào và như thế nào) và chính phủ (ví dụ: kỹ năng nào hiện có hoặc còn thiếu trong một nhóm dân số cụ thể). Các đầu ra dữ liệu này có tính biểu diễn, tức là dẫn đến hành động xã hội và có tác động. Chúng có thể có hậu quả ở cấp độ tổ chức (ví dụ: khi một trường đại học quyết định can thiệp vào cuộc sống của sinh viên dựa trên điểm số thuật toán), ở cấp độ thương mại (ví dụ: nhà xuất bản quyết định xuất bản văn bản học thuật nào dựa trên số liệu thống kê về việc đọc, có thể dựa trên sự thúc đẩy hành vi), ở cấp độ chính sách (ví dụ: chính phủ đưa ra quyết định về chính sách), v.v… Do đó, điều quan trọng là loại dữ liệu đầu ra nào được xây dựng, bởi ai, với mục đích và hậu quả gì.

Thực hành dữ liệu không phải là dân chủ

Dữ liệu hóa giáo dục đại học không chỉ là thách thức về mặt công nghệ và pháp lý, mà còn là một quá trình đầy mâu thuẫn và bất đồng. Nhiều cá nhân liên tục nêu lên mối quan ngại về các hoạt động dữ liệu. Các học giả thường thấy rằng các hoạt động giảng dạy và học tập đã được thiết lập trước đó có ý nghĩa hơn (ví dụ: mối quan hệ chặt chẽ giữa học giả và sinh viên, đánh giá hình thành) so với việc thu thập dữ liệu và đầu ra mở rộng (ví dụ: phân tích học tập). Tuy nhiên, những cá nhân nêu lên mối quan ngại thường cảm thấy bị buộc tội là chống lại tiến trình. Nếu áp dụng nhiều số liệu khác nhau cho các cá nhân mà họ không thấy được lợi ích, dữ liệu hóa sẽ không đạt được mục tiêu đã đề ra. Điều này cho thấy những đấu tranh nội bộ phức tạp và những động lực và mục tiêu khác nhau liên quan đến loại dữ liệu hóa mà chúng ta muốn, tại sao và như thế nào, trong một tổ chức và giữa các tổ chức hoặc hệ thống. Nếu không dành thời gian cho một cuộc thảo luận và thống nhất cởi mở và dân chủ giữa các thành phần giáo dục đại học, dữ liệu hóa giáo dục đại học không thể thực hiện được những lời hứa của mình.

Con đường phía trước

Nghiên cứu chỉ ra rằng dữ liệu hóa được hình dung và áp đặt lên từng nhân viên và sinh viên bởi chính phủ, các công ty EdTech hoặc lãnh đạo trường đại học sẽ không mang lại kết quả tích cực. Thay vào đó, những điều sau đây có thể mang lại kết quả tốt hơn. Đầu tiên, điều quan trọng là các mô hình kinh doanh của các công ty EdTech phải được coi là hợp pháp, để các thành phần của trường đại học không cảm thấy bị lợi dụng. Thứ hai, dữ liệu hóa được đánh giá cao để hỗ trợ các quy trình hành chính và hiệu quả, chẳng hạn như tiết kiệm chi phí cho phần mềm hoặc cấp phép xuất bản dựa trên xu hướng sử dụng hoặc đọc. Việc quảng bá đầu ra dữ liệu hoặc các sản phẩm dữ liệu hóa phải trung thực, hợp lệ và có bằng chứng, cũng như cho phép sử dụng đa dạng và linh hoạt và cá nhân có thể sử dụng. Phải có mục đích rõ ràng và được thống nhất đối với đầu ra dữ liệu nhập vào hệ thống giáo dục đại học ở mọi cấp độ và quy mô. Việc thử nghiệm với dữ liệu hóa có vẻ hữu ích, nhưng nó sẽ cho phép quay lại nếu đầu ra dữ liệu không mang lại giá trị cho người dùng. Các công ty EdTech nên hợp tác với các trường đại học một cách tôn trọng và hỗ trợ các mục tiêu, văn hóa và cộng đồng của trường. Cuối cùng, việc dành thời gian và chậm lại để đổi mới một cách có trách nhiệm và thử nghiệm các sản phẩm, cũng như đầu tư đủ nguồn lực vào dữ liệu hóa tốt là điều tối quan trọng.