Những áp lực đến từ chỉ số trong đánh giá hiệu quả nghiên cứu – Tạp chí Giáo dục International Higher Education

Emanuel Kulczycki là giáo sư về trao đổi học thuật tại Đại học Adam Mickiewicz, Poznań, Ba Lan. Email: [email protected]. Bài viết dựa trên cuốn sách The Evaluation Game: How Publication Metrics Shape Scholarly Communication, Đại học Cambridge xuất bản năm 2023.

Tóm tắt: Việc đánh giá nghiên cứu dựa trên chỉ số – có nguồn gốc từ Nga và Liên Xô cũ – vẫn đang tác động đến hoạt động xuất bản khoa học ngày nay. Thực trạng phổ biến là việc số lượng xuất bản được coi trọng hơn các yếu tố khác, và các nhà nghiên cứu buộc phải thích nghi với điều đó. Với mục đích nhằm bảo vệ vị thế của bản thân, họ phải tham gia vào một hành vi được gọi là “cuộc chơi của sự đánh giá” (evaluation game). Cần có sự chuyển đổi trọng tâm từ thành tựu cá nhân sang những yêu cầu chung của xã hội, để đảm bảo các chỉ số này được áp dụng phù hợp với mục tiêu chung, cũng như các giá trị và niềm tin của cộng đồng học thuật.

Tác động sâu sắc của các phát kiến khoa học thường được thể hiện rõ nhất trong những thời điểm khủng hoảng, với ví dụ tiêu biểu là các nghiên cứu mang tính chất đột phá, dẫn tới sự phát triển của vắc-xin COVID-19. Tuy nhiên, khoa học hiện đại đang ngày càng chú trọng vào việc xuất bản hơn là tập trung cho các phát kiến mới. Áp lực không ngừng về việc phải cho ra đời các ấn phẩm mới khiến các nhà nghiên cứu không còn thời gian để làm những công việc cốt lõi, dẫn tới một làn sóng ồ ạt các ấn phẩm khoa học được xuất hiện, thường đến từ các học giả tập sự. Chủ nhân giải Nobel Peter Higgs cho rằng chính bản thân ông cũng không thể đạt được tiêu chuẩn về năng suất học thuật trong thời đại này. Vậy nhưng, chỉ mỗi số lượng ấn phẩm khoa học được tăng lên không phải tất cả. Số lượt trích dẫn phải chăng mới là đơn vị giá trị đích thực của giới khoa học.

Cuốn sách “Cuộc chơi đánh giá: Chỉ số xuất bản đã định hình trao đổi học thuật như thế nào (The Evaluation Game: How Publication Metrics Shape Scholarly Communication) đã đem đến một góc nhìn mới hơn về nguồn căn và hệ quả của các chỉ số trong học thuật, cũng như đề xuất phương hướng cải thiện việc đánh giá nghiên cứu. Thông qua việc xem xét cả những ảnh hưởng tích cực, lẫn tiêu cực của các thông lệ đánh giá nghiên cứu, cũng như việc khám phá cách mà những điều này diễn ra trên thế giới, cuốn sách này đã giúp đưa toàn ngành hướng về một cách tiếp cận cân bằng và hiệu quả hơn trong việc đánh giá các công trình học thuật.

Sự trỗi dậy của các chỉ số và hệ thống đánh giá nghiên cứu

Trong bối cảnh các trường đại học ngày càng bị chi phối bởi quy luật thị trường, việc chú trọng lượng hóa năng suất nghiên cứu và trách nhiệm trong khoa học càng được tăng cường. Hệ quả của những chuyển đổi này là rất sâu rộng và tiếp tục là chủ đề tranh luận trong cộng đồng học thuật.

Các chỉ số được sử dụng một cách phổ biến, phục vụ cho các mục đích khác nhau, như đánh giá các nhà nghiên cứu với tư cách cá nhân, thẩm định kết quả của các dự án được tài trợ hoặc so sánh và đo lường năng suất của các cơ sở học thuật. Hệ số tác động tạp chí (JIF – Journal Impact Factor) vẫn là chỉ số được coi trọng hàng đầu. Ở Hoa Kỳ, 40% các cơ sở chuyên nghiên cứu sử dụng JIF trong việc đánh giá, xem xét thăng tiến và nâng lương. Với mục đích ban đầu nhằm đánh giá số người đọc tạp chí, JIF đã phát triển thành một công cụ toàn diện để đánh giá các khía cạnh khác nhau trong bối cảnh chung của ngành nghiên cứu. Ngoài ra, có những giải pháp tiếp cận theo hướng đi từ trên xuống dưới (top-down) dựa trên chỉ số được sử dụng ở cấp quốc gia thay vì cấp cơ sở. Nhiều quốc gia – bao gồm Úc, Trung Quốc, Phần Lan, Na Uy, Ba Lan và Vương quốc Anh (nổi tiếng với Khung đánh giá tính xuất sắc nghiên cứu) – đã xây dựng các hệ thống đánh giá nghiên cứu quốc gia. Những hệ thống này hỗ trợ chính phủ không chỉ trong việc giám sát các hoạt động trong lĩnh vực khoa học và giáo dục đại học mà trong nhiều trường hợp còn trong việc phân bổ quỹ tài trợ.

Cộng đồng khoa học từ lâu đã nỗ lực chống lại việc lạm dụng cũng như lợi dụng các chỉ số. Các bước tiến như Tuyên bố San Francisco về Đánh giá Nghiên cứu khoa học (DORA) và Biên bản Leiden đã cố gắng kiện toàn các phương pháp đánh giá đầu ra của nghiên cứu khoa học. Các quỹ đầu tư, các cơ sở nghiên cứu và các bên liên quan khác là mục tiêu tác động của những nỗ lực này.

Lịch sử: chuyện chưa kể và những hệ quả

Cuốn sách “Cuộc chơi Đánh giá” khai thác những câu chuyện chưa kể trong lịch sử đo lường khoa học. Một trong số những câu chuyện đó là về việc dưới góc độ địa chính trị, áp lực xuất bản đã tạo nên những hệ quả như thế nào. Các hệ quả này thường là rất đa dạng và phụ thuộc vào từng bối cảnh văn hóa và lịch sử của quá trình ứng dụng hệ thống đánh giá nghiên cứu. Vì vậy ở Mỹ, châu Âu và Đông Âu, người ta tin vào chỉ số hơn là nhận định của chuyên gia, tuy nhiên mức độ của việc này còn phụ thuộc vào môi trường.

Sự khác biệt đó được giải thích phần nào khi tìm hiểu sâu hơn về tiềm năng hiện đại hóa của các chỉ số và đo lường – những hệ thống được sử dụng ở đế chế Nga và sau đó là Liên Xô cũ. Điều tra cho thấy các chỉ số với mục đích sử dụng nhằm giám sát và đánh giá học thuật, đã được triển khai tại Nga hơn một thế kỷ rưỡi trước khi lý thuyết tân khai phóng xuất hiện trong các lĩnh vực khoa học và giáo dục đại học. Do đó, hệ thống đánh giá nghiên cứu quốc gia đầu tiên ở Liên Xô cũ thực chất khởi nguồn từ các nghiên cứu, mà ban đầu chỉ thuần túy được thực hiện do sự tò mò, với chủ đề quan sát là các phản ứng khác biệt đối với các chỉ số ở các quốc gia khác nhau. Đây là một hệ thống đánh giá mang tính dự đoán, chủ yếu nhằm đảm bảo tính phù hợp của các nghiên cứu với các giá trị và mục tiêu chính trị của quốc gia.

Nghiên cứu về nguồn gốc vấn đề đo lường các trao đổi học thuật cũng dẫn đến một câu chuyện chưa từng kể về nguồn gốc bộ môn “Khoa học của khoa học” tại Ba Lan và vai trò ngành trắc lượng khoa học của Liên Xô. Bộ môn “Khoa học của khoa học” được dùng để thúc đẩy các thay đổi trong chính sách khoa học sau Thế chiến I, và trắc lượng khoa học của Liên Xô – lấy cảm hứng từ cách tiếp cận của Ba Lan – đã đặt nền móng cho nhiều hệ thống đánh giá nghiên cứu sau này. Di sản của những hệ thống này tồn tại ở hầu hết các nước châu Âu ngày nay, trở thành thực trạng khi bản thân các chỉ số này được người ta tin cậy hơn là nhận định của chuyên gia.

Thích nghi với cuộc chơi đánh giá

Việc đánh giá các nhà nghiên cứu và các trường đại học đã gợi ra nhiều phản ứng trái chiều so với các kỳ vọng đặt ra. Một số hệ thống dựa trên chỉ số đã thành công thúc đẩy các nhà nghiên cứu thay đổi chiến lược xuất bản, với định hướng nhắm tới các đơn vị xuất bản có chất lượng cao hơn cũng như uy tín hơn. Ngược lại, nhiều nhà nghiên cứu khác chỉ tuân theo các quy tắc đánh giá và để tiết kiệm công sức, chỉ làm vừa đủ để đáp ứng mục tiêu chỉ số và thường dẫn đến nhiều bài viết đôi khi thiếu chất lượng, được đăng tải tại những nơi thiếu uy tín. Tuy nhiên, một bộ phận lớn trong số những người này chỉ nên được coi là đang “tham dự cuộc chơi đánh giá” thay vì đang thật sự “làm chủ cuộc chơi”. Cuốn sách chỉ ra rằng khái niệm “làm chủ cuộc chơi” không áp dụng được trong những trường hợp này vì nó không mô tả chính xác cái cách mà nhiều nhà nghiên cứu đang hoạt động. Họ chỉ đang cố thay đổi các thông lệ trao đổi học thuật chuyên nghiệp nhằm thích nghi với áp lực xuất bản và chỉ số đánh giá, vậy nên họ xuất bản nhiều ấn phẩm chất lượng thấp thay vì tạo ra một ấn phẩm xuất sắc để có thể duy trì vị thế cho họ khi ưu tiên số lượng xuất bản thay vì chất lượng (dưới góc nhìn của hệ thống đánh giá mà họ đang bị phụ thuộc vào). Nói cách khác, khi đã tham gia cuộc chơi đánh giá, động lực chính của mỗi nhà nghiên cứu là giữ nguyên hiện trạng thay vì vươn lên tối ưu lợi ích chung.

Lĩnh vực học thuật không thể tránh khỏi việc áp dụng các chỉ số, nhưng chúng ta phải chấm dứt việc lưu hành quan điểm cho rằng, việc nghiên cứu khoa học chỉ đơn giản là đưa ra một loạt các ấn phẩm khoa học đến từ các nhà nghiên cứu riêng biệt, những người đang làm việc trong những viện nghiên cứu ở khắp mọi nơi.

Thay vì phụ thuộc vào chỉ số, hãy tận dụng chỉ số

Lĩnh vực học thuật không thể tránh khỏi việc áp dụng các chỉ số, nhưng chúng ta phải chấm dứt việc lưu hành quan điểm cho rằng, việc nghiên cứu khoa học chỉ đơn giản là đưa ra một loạt các ấn phẩm khoa học đến từ các nhà nghiên cứu riêng biệt, những người đang làm việc trong những viện nghiên cứu ở khắp mọi nơi. Chúng ta cũng không thể quay trở lại thời kỳ không đặt chỉ số hay chỉ tiêu trong quản lý và tổ chức khoa học vì điều đó là bất khả thi. Chỉ số luôn được sử dụng – hoặc với tư cách là một công cụ hiện đại hoá, hoặc với tư cách là một công cụ kiểm tra và giám sát.

Cuốn sách “Cuộc chơi Đánh giá” kêu gọi các nhà hoạch định chính sách quản lý và các nhà nghiên cứu thực thi bảy nguyên tắc để giúp cho hệ thống trao đổi học thuật dựa trên chỉ số được cân đối hơn. Thứ nhất, cần tạo ra một môi trường học thuật truyền cảm hứng cho các nhà nghiên cứu và nhà quản lý về việc trở nên xuất sắc. Thứ hai, cần tăng mạnh nguồn tài trợ nghiên cứu một cách ổn định thông qua các khoản ngân sách từ địa phương. Thứ ba, cần đảm bảo việc làm ổn định và mức lương cạnh tranh, đặc biệt là đối với những nhà nghiên cứu ở giai đoạn đầu của sự nghiệp. Thứ tư, cần mời các nhà nghiên cứu cùng tham gia quá trình định nghĩa tiêu chí đánh giá và hệ thống chỉ số. Thứ năm, cần loại bỏ khía cạnh cá nhân hóa trong đánh giá và công nhận rằng khoa học hiện đại yêu cầu sự nỗ lực hợp tác. Thứ sáu, để chính các cấp cơ sở tự quản lý cơ sở hạ tầng về trao đổi học thuật. Cuối cùng, phải đảm bảo tính minh bạch và việc dễ dàng truy cập các nguồn thông tin khi đánh giá dựa trên chỉ số. Bằng việc áp dụng những nguyên tắc này, chúng ta có thể thúc đẩy một môi trường học thuật cân đối, hiệu quả và mang tính cộng tác cao hơn, ưu tiên chất lượng hơn số lượng. Cần đảm bảo rằng cách sử dụng các chỉ số sẽ được điều hướng bởi các mục tiêu, giá trị và niềm tin của chúng ta thay vì để chúng điều chỉnh ngược lại các giá trị cốt lõi của chính chúng ta.