Dữ liệu theo chiều dọc toàn cầu về tuyển sinh đại học (GLUED)

Elizabeth Buckner

Elizabeth Buckner là Phó Giáo sư giáo dục đại học tại Viện Nghiên cứu Giáo dục Ontario (OISE), Đại học Toronto, Canada. E-mail: elizabeth.buckner@utoronto.ca.

Tóm tắt

Dữ liệu liên quốc gia hiện có về sự tham gia vào giáo dục đại học còn nhiều hạn chế: Nó được thu thập chủ yếu ở cấp quốc gia, trộn lẫn giáo dục ngắn hạn sau phổ thông trung học với giáo dục bậc đại học và không tách riêng dữ liệu về khu vực tư thục trước năm 1998. Dữ liệu theo chiều dọc toàn cầu về tuyển sinh đại học (GLUED) tìm cách giải quyết những hạn chế này. Dữ liệu này tổng hợp và ước tính số liệu tuyển sinh ở cấp trường vào các trường đại học trên toàn thế giới từ năm 1950 – 2020. Bài báo này thảo luận về những lợi thế mà GLUED mang lại cho các nhà nghiên cứu về giáo dục đại học.

———

Khu vực đại học tư thục (tức là ISCED 6+) có quy mô như thế nào trên toàn cầu trong những năm 1970? Và giáo dục đại học tư thục gần đây phát triển chủ yếu nhờ vào những trường đại học tư thục mới hay thông qua

việc mở rộng tuyển sinh của những cơ sở đã có trước đó? Đây chỉ là một số câu hỏi mà các học giả về giáo dục đại học tư thục nêu ra để hiểu rõ hơn về sự phát triển của giáo dục đại học tư thục trên toàn thế giới và ảnh hưởng của nó đến bối cảnh giáo dục đại học, chính sách và sinh viên.

Tuy nhiên, cho đến nay, rất khó để các học giả về giáo dục đại học so sánh sự tăng trưởng gần đây với những giai đoạn trước, do thiếu dữ liệu về giáo dục đại học tư thục trước năm 2000. Bài viết này thảo luận về những vấn đề của dữ liệu về tuyển sinh đại học và giới thiệu một tập dữ liệu mới nhằm thúc đẩy nghiên cứu về các trường đại học trên toàn thế giới theo thời gian.

Thiếu dữ liệu về tuyển sinh giáo dục bậc đại học theo ngành

Dữ liệu hiện có phục vụ cho nghiên cứu giáo dục đại học tư thục xuyên quốc gia có nhiều hạn chế. Viện Thống kê của UNESCO (UIS) bắt đầu thu thập dữ liệu về tỷ lệ tuyển sinh đại học tư thục trên toàn thế giới vào năm 1998. Tuy nhiên, vào năm 1998, chỉ có dữ liệu về 14 quốc gia. Đến năm 2005, đã có dữ liệu về tỷ lệ tuyển sinh đại học tư thục của 72 quốc gia. Dữ liệu UIS đạt đỉnh vào năm 2015; tại thời điểm đó, ước tính có dữ liệu của 127 quốc gia; sau đó lại trở thành khan hiếm, rất có thể do độ trễ tự nhiên của việc báo cáo. Đến năm 2020, ước tính chỉ có sẵn dữ liệu của 54 quốc gia. Dữ liệu UIS còn gặp một vấn đề khác, là nó phụ thuộc vào báo cáo của các chính phủ quốc gia hoặc liên bang, điều đó có nghĩa là một số quốc gia không bao giờ có dữ liệu, bao gồm cả Canada là quốc gia của người viết bài này.

Hơn nữa, định nghĩa của UNESCO về “công lập” và “tư thục” không phải lúc nào cũng tương đương với định nghĩa của các quốc gia hoặc với cách hiểu phổ biến về giáo dục đại học công lập và tư thục. Hệ quả của điều này thể hiện rõ ràng ở những quốc gia như Vương quốc Anh, nơi các trường đại học tư thục được thống kê là chiếm 100% tổng số tuyển sinh trong tất cả các năm.

Do đó, những học giả quan tâm đến cách ước tính chính xác hơn về giáo dục đại học tư thục theo cách hiểu phổ biến và chính sách của chính phủ đã chuyển sang những nguồn dữ liệu như Chương trình Giáo dục Đại học Tư thục (PROPHE). Trang web của PROPHE đưa ra những ước tính chi tiết về quốc gia dựa trên UIS, cũng như các nguồn của chính phủ và các chuyên gia cấp quốc gia trong trường hợp dữ liệu của chính phủ không có sẵn. Tuy nhiên, một hạn chế với PROPHE là cho đến nay, PROPHE mới chỉ cung cấp công khai được dữ liệu của năm 2010, điều này gây khó khăn cho việc theo dõi những xu hướng dài hạn.

Hạn chế thứ ba của những tập dữ liệu hiện có là dữ liệu có sẵn về giáo dục đại học tư thục lại trộn lẫn giáo dục ngắn hạn sau phổ thông trung học (tức là ISCED 5) với các trường đại học (tức là ISCED 6+) – là những tổ chức cấp bằng cử nhân và/ hoặc bằng cấp cao hơn. Tuy nhiên, thành tích trong giáo dục đại học qua nhiều thập kỷ đã ghi nhận những đặc điểm khác biệt của các trường đại học, đó là định hướng nghiên cứu nhiều hơn, tham gia vào các bảng xếp hạng toàn cầu và có xu hướng được nhiều quyền tự do học thuật hơn. Đối với chúng ta, những người đặc biệt quan tâm đến các trường đại học như những tổ chức xã hội, việc trộn lẫn dữ liệu về giáo dục ngắn hạn sau phổ thông trung học với dữ liệu về giáo dục bậc đại học là mối quan tâm chính.

Những vấn đề liên quan đến giáo dục đại học tư thục được các nhà nghiên cứu giáo dục đại học chia sẻ một cách tổng quát hơn: Hầu hết những dữ liệu công khai về giáo dục đại học được tính toán ở cấp quốc gia, dữ liệu về tuyển sinh vào những chương trình ngắn hạn bị trộn lẫn với dữ liệu về tuyển sinh vào bậc đại học, và dữ liệu này chỉ mới được tiếp cận rộng rãi trong vài năm gần đây.

Giới thiệu GLUED – phiên bản Beta

Rõ ràng, cần có tập dữ liệu dọc tốt hơn về tuyển sinh theo ngành cụ thể vào các trường đại học. Dữ liệu theo chiều dọc toàn cầu về tuyển sinh đại học (GLUED – The Global Longitudinal University Enrollment Dataset) là một tập dữ liệu mới tìm cách thực hiện điều này. Ba ưu điểm chính của GLUED là nó đại diện cho một cuộc điều tra dân số của các trường đại học (ISCED 6+) gần như trên toàn thế giới; dữ liệu được thu thập ở cấp độ tổ chức, điều này sẽ cho phép các nhà nghiên cứu tìm hiểu những hiện tượng ở cấp độ tổ chức; và nhiều tổ chức có được dữ liệu tuyển sinh thô và ước tính từ năm 1950.

Việc xây dựng GLUED đã kéo dài nhiều năm. Dữ liệu được thu thập tại Viện Nghiên cứu Giáo dục Ontario (OISE) thuộc Đại học Toronto và được Hội đồng Nghiên cứu Khoa học Xã hội và Nhân văn (SSHRC) của Canada tài trợ hào phóng. Từ năm 2018 – 2020, một nhóm trợ lý nghiên cứu đã nhập dữ liệu tuyển sinh của hàng nghìn trường đại học theo cách thủ công từ các tập tài liệu lưu trữ bản cứng của cả Europa World of Learning và Cơ sở dữ liệu Giáo dục Đại học Thế giới của Hiệp hội Các trường đại học quốc tế (IAU). Dữ liệu này được bổ sung bằng dữ liệu từ Hệ thống Dữ liệu Giáo dục Sau Trung học Tích hợp (IPEDS) của Hoa Kỳ, dữ liệu tuyển sinh gần đây từ phiên bản kỹ thuật số của Cơ sở Dữ liệu Giáo dục Đại học Thế giới do IAU lưu trữ, và số liệu tuyển sinh đại học được lấy từ Wikipedia. Tất cả dữ liệu đã được kiểm tra và làm sạch. Dữ liệu bị thiếu của những năm trước sẽ được ước tính dựa trên tỷ lệ tăng trưởng hoặc đặc điểm thể chế cụ thể của mỗi tổ chức, và được hiệu chỉnh cho phù hợp với những nguồn đã xuất bản ở cấp độ toàn cầu và quốc gia.

GLUED cung cấp tên và những đặc điểm các trường, bao gồm ước tính số lượng sinh viên nhập học trong khoảng thời gian 5 năm – của 15.263 cơ sở giáo dục đại học tại 185 quốc gia và vùng lãnh thổ. Tập dữ liệu thứ hai cấp quốc gia về tuyển sinh theo ngành cụ thể được tổng hợp ở cấp quốc gia cũng đã sẵn sàng để được sử dụng.

GLUED còn bao gồm một số biến hữu ích khác về đặc điểm các trường, được hợp nhất từ nhiều nguồn khác nhau, bao gồm khu vực giáo dục (tức là công lập/ tư thục), năm thành lập, có được cấp bằng tiến sĩ hay không. Các trường đại học tự công bố – là công lập hay tư thục – căn cứ vào nguồn gốc ban đầu của tổ chức, dựa trên quyền kiểm soát hoặc quyền sở hữu của tổ chức; và GLUED chấp nhận định nghĩa đó. Tập dữ liệu này không phân loại trường đại học theo tiêu chí vì lợi nhuận hay phi lợi nhuận, cũng như chưa có số liệu về việc một trường đại học là tổ chức tôn giáo hay không; nhưng đây là điều mà những phiên bản trong tương lai của tập dữ liệu có thể bổ sung.

Cuối cùng, một trong những tính năng thú vị của GLUED là nó bao gồm vị trí địa lý (tức là tọa độ GPS) của từng trường đại học, được lấy từ Google Maps. Dữ liệu này có thể được sử dụng để lập bản đồ địa lý các trường đại học trong bộ dữ liệu và hình dung sự phát triển của các trường đại học trên toàn thế giới, và có thể được các nhà nghiên cứu sử dụng cho nhiều mục đích khác nhau.

Tập dữ liệu này hiện đang ở phiên bản beta, trong đó quá trình làm sạch dữ liệu và ước tính những giá trị bị thiếu đang được hoàn thiện. GLUED sẽ được xuất bản vào đầu mùa thu năm 2022 trên Dataverse của Đại học Toronto, và có thể truy cập được thông qua Borealis, Cơ quan lưu trữ dữ liệu của Canada, tại liên kết cố định sau: https://doi.org/10.5683/SP3/P0D1KE.