Dữ liệu lớn và nghiên cứu về nghề nghiệp học thuật: Hướng tới một chương trình nghiên cứu mới

Marek Kwiek

Marek Kwiek là Giáo sư và Chủ tịch UNESCO về Nghiên cứu thể chế và Chính sách Giáo dục Đại học tại University of Poznan, Ba Lan. E mail: [email protected].

Từ khóa cho tương lai của nghiên cứu về nghề nghiệp học thuật là tính bổ trợ. Những hiểu biết từ các khảo sát, dù quy mô lớn hay nhỏ, về bản chất khác biệt so với những gì thu được từ phỏng vấn – nhưng khi được kết hợp, chúng có thể thúc đẩy sự phát triển của lĩnh vực này cả về mặt lý thuyết lẫn thực nghiệm. Do đó, dữ liệu lớn nên đóng vai trò bổ trợ cho khảo sát và phỏng vấn, trong khi các phân tích ở cấp độ vĩ mô cũng cần đi đôi với các nghiên cứu ở cấp độ vi mô.

Tác động của quá trình ngày càng tăng của toàn cầu hóa và số hóa trong khoa học đối với lĩnh vực nghiên cứu giáo dục đại học là rất lớn. Cách tiếp cận như cũ – trong bối cảnh có nhiều cơ hội mới và các lĩnh vực cạnh tranh đang theo đuổi những chương trình nghiên cứu tương tự sẽ làm giảm sức hấp dẫn của lĩnh vực này đối với cộng đồng học thuật và hoạch định chính sách. Việc dữ liệu số về các hoạt động học thuật ngày càng sẵn có sẽ tạo ra ảnh hưởng mạnh mẽ đối với lĩnh vực nghiên cứu này.

Sự trỗi dậy của khoa học dữ liệu

Các nhà khoa học xã hội truyền thống hiện đang phải cạnh tranh với các nhà khoa học dữ liệu và các nhà khoa học xã hội tính toán – những người ngày càng tập trung vào các vấn đề vốn đã được nghiên cứu từ lâu trong lĩnh vực giáo dục đại học. Để duy trì tính cạnh tranh, lĩnh vực này cần phải chấp nhận các công cụ và bộ dữ liệu mới đang nổi lên trong khoa học xã hội dựa trên dữ liệu quy mô lớn.

Áp lực ngày càng gia tăng cả từ bên trong lẫn bên ngoài giới học thuật để sử dụng các bộ dữ liệu lớn hơn nhằm đưa ra các kết luận có giá trị. Nhu cầu định lượng hóa các sự nghiệp học thuật đang tăng lên, trong khi các khảo sát học thuật quy mô nhỏ đang dần mất sức hút trong giới khoa học xã hội. Cỡ mẫu nhỏ làm hạn chế phạm vi phân tích và làm suy yếu các khuyến nghị chính sách. Số lượng quan sát thấp theo loại hình, giới tính, ngành học, loại hình thể chế, nhóm tuổi hay nhóm năng suất làm giảm sức mạnh phân tích và độ tin cậy của chính sách đưa ra. Để vượt ra khỏi các phương pháp phân tích tiêu chuẩn (đã được sử dụng trong nhiều thập kỷ) và để chứng minh rằng công cụ khảo sát vẫn có sức hấp dẫn trong nghiên cứu về nghề nghiệp học thuật, các khảo sát trong tương lai cần thu thập bảng hỏi từ số lượng lớn hơn các nhà khoa học. Đây chính là cách mà các đối thủ lớn của lĩnh vực – các nhà phân tích dữ liệu và khoa học máy tính – đang tiến hành nghiên cứu hiện nay.

Cơ hội cho nghiên cứu giáo dục đại học

Lĩnh vực nghiên cứu giáo dục đại học đang đứng trước những cơ hội đáng kể nếu hiểu được cách mà các tiến bộ liên quan đến toàn cầu hóa đã được sử dụng để cạnh tranh có được sự chú ý của giới học thuật và các nhà hoạch định chính sách. Dữ liệu số về tài trợ nghiên cứu, năng suất, hợp tác, tác động và sự dịch chuyển hiện nay có thể được khai thác ở quy mô chưa từng có và với mức độ chi tiết rất cao. Nghiên cứu về nghề nghiệp học thuật có thể được chuyển mình theo những cách chưa từng thấy trước đây.

Tuy nhiên, những cơ hội này cũng đi kèm với cái giá phải trả: Sự cạnh tranh ngày càng khốc liệt. Nhiều lĩnh vực và phân ngành hiện đang nghiên cứu về giới học thuật và các bối cảnh thể chế của họ, khiến nghiên cứu giáo dục đại học chỉ còn là một trong nhiều lĩnh vực tập trung vào các sự nghiệp học thuật. Khi vẫn chủ yếu dựa vào các phương pháp truyền thống và bộ dữ liệu nhỏ, lĩnh vực này đang đứng trước nguy cơ bị tụt lại phía sau so với các lĩnh vực đã tận dụng được sức mạnh của dữ liệu lớn – đặc biệt là các bộ dữ liệu thư mục học thuật quy mô lớn như Scopus, Web of Science hoặc OpenAlex. Câu hỏi đặt ra là trong tương lai, dữ liệu, diễn giải và tri thức về lĩnh vực học thuật sẽ được đặt ở đâu?

Từ khóa cho tương lai của lĩnh vực này là “tính bổ trợ” (complementarity). Trong nghiên cứu về nghề nghiệp học thuật, dữ liệu lớn nên đóng vai trò bổ sung cho khảo sát và phỏng vấn; các phân tích cấp vĩ mô nên được đi kèm với nghiên cứu cấp vi mô. Những hiểu biết thu được từ khảo sát – dù là quy mô lớn hay nhỏ – có bản chất khác biệt so với dữ liệu từ phỏng vấn. Tuy nhiên, khi kết hợp với nhau, chúng có thể thúc đẩy sự phát triển của lĩnh vực cả về mặt lý thuyết lẫn thực nghiệm.

Cụ thể hơn, nhiều vấn đề truyền thống trong nghiên cứu giáo dục đại học hiện đang ngày càng được khảo sát trong các lĩnh vực như “khoa học về khoa học” (science of science), các nghiên cứu định lượng và lĩnh vực gọi là “nghiên cứu về hệ thống nghiên cứu” (research on research). Khoa học xã hội đang bước vào thời kỳ hoàng kim, khi các nhà khoa học trong các lĩnh vực dữ liệu chuyên sâu kể trên đang sử dụng các nguồn dữ liệu lớn cùng sức mạnh tính toán và kỹ năng phân tích như một phần của cuộc cách mạng dữ liệu lớn.

Nghiên cứu về nghề nghiệp học thuật đang đối mặt với khoa học dữ liệu như một đối thủ cạnh tranh chính. Các nghiên cứu quy mô lớn về sự nghiệp học thuật – dựa trên hàng trăm nghìn hoặc hàng triệu hồ sơ cá nhân về sự nghiệp và công bố khoa học – đang thách thức các nghiên cứu dựa trên khảo sát quy mô nhỏ cả về mặt học thuật lẫn chính sách.

Trong cuộc cạnh tranh giữa phương pháp khảo sát và phương pháp sử dụng các bộ dữ liệu số lớn, cách tiếp cận truyền thống dựa vào khảo sát nhỏ đang dần thất thế. Cuộc cạnh tranh này không chỉ giới hạn ở mức độ được đọc và trích dẫn rộng rãi hơn, mà còn liên quan đến giá trị học thuật (tạo ra uy tín và vị thế) và khả năng thu hút tài trợ (tạo ra nguồn lực). Các nghiên cứu mới từ lĩnh vực khoa học máy tính hiện đang khám phá các vấn đề như phân tầng xã hội, cấu trúc sự nghiệp học thuật và hệ thống công nhận trong các ngành và các quốc gia khác nhau.

Tuy nhiên, những nghiên cứu này lại dựa phần lớn vào các khung lý thuyết được phát triển trong lĩnh vực nghiên cứu giáo dục đại học. Các lý thuyết mà chúng ta đã xây dựng trong suốt năm thập kỷ qua vẫn là nền tảng quan trọng cho sự phát triển trong tương lai của lĩnh vực này. Ngày nay, lĩnh vực nghiên cứu giáo dục đại học cần nhận thức rõ những gì mà các lĩnh vực cạnh tranh đang mở rộng có thể mang lại cho cộng đồng học thuật và chính sách, đồng thời không đánh mất bản sắc riêng của mình. Cách tiến lên tốt nhất là duy trì trình độ lý thuyết hóa sâu sắc, đồng thời tích hợp các công cụ phương pháp mới và các bộ dữ liệu số phục vụ cho mục tiêu nghiên cứu. Điều đó có nghĩa là tiếp tục đặt ra những câu hỏi cốt lõi đã được đặt ra trong nhiều thập kỷ – chẳng hạn như về năng suất, hợp tác, ảnh hưởng và sự dịch chuyển – cùng với những câu hỏi mới, nhưng áp dụng các phương pháp phân tích dựa trên dữ liệu chuyên sâu và nguồn dữ liệu số mà cuộc cách mạng kỹ thuật số đã mang lại.

Con đường phía trước

Các nghiên cứu trong tương lai về nghề nghiệp học thuật (và các sự nghiệp học thuật) có thể được nâng cao đáng kể nếu kết hợp hiệu quả các phân tích thư mục định lượng và các công cụ khảo sát, bộ dữ liệu và phương pháp luận để nghiên cứu toàn bộ lĩnh vực học thuật bằng cách kết hợp dữ liệu công bố và trích dẫn, khảo sát quy mô lớn, phỏng vấn số lượng lớn (có thể có hỗ trợ của trí tuệ nhân tạo), cùng với (nếu có thể) dữ liệu tiểu sử và nghề nghiệp từ các cơ sở dữ liệu quốc gia của các nhà khoa học hoặc dữ liệu thương mại về sự nghiệp học thuật. Sự kết hợp nhiều phương pháp có thể giúp chúng ta hiểu rõ hơn về những thay đổi và sự phức tạp của công việc học thuật dưới áp lực chính trị và kinh tế ngày càng gia tăng.

Từ khóa cho tương lai của lĩnh vực này là “tính bổ trợ” (complementarity). Trong nghiên cứu về nghề nghiệp học thuật, dữ liệu lớn nên đóng vai trò bổ sung cho khảo sát và phỏng vấn; các phân tích cấp vĩ mô nên được đi kèm với nghiên cứu cấp vi mô. Những hiểu biết thu được từ khảo sát – dù là quy mô lớn hay nhỏ – có bản chất khác biệt so với dữ liệu từ phỏng vấn. Tuy nhiên, khi kết hợp với nhau, chúng có thể thúc đẩy sự phát triển cả về mặt lý thuyết lẫn thực hành.