📚 AI가 논문을 50% 더 쏟아내게 했더니, 과학이 오히려 '좁아졌다' — 생산성의 역설이 학계를 뒤흔든다
코넬대·네이처 공동 연구가 충격적인 결론을 내놓았다.
ChatGPT 등장 이후 과학자들의 논문 생산량이 최대 50% 급증했다. 특히 영어가 모국어가 아닌 연구자들이 가장 큰 수혜를 받았다. 언어 장벽이 무너진 것이다.
그런데 문제는 그 다음이었다.
AI로 작성된 논문들은 기존 연구 대비 4.6% 더 좁은 주제만 다루고 있었다. 같은 데이터셋, 비슷한 방법론, 유사한 결론 — AI가 '잘 되는 패턴'을 반복 생성하면서 과학 전체의 다양성이 줄어든 것이다.
더 심각한 건 논문 간 상호 인용률 하락이다. 각자 AI로 빠르게 논문을 찍어내느라, 남의 연구를 읽고 연결하는 과정이 사라지고 있다.
학술지 편집자들은 AI로 대량 생산된 저품질 원고가 쏟아진다고 호소한다. 문장은 매끄럽지만 내용은 얕다. 과거에는 '복잡하지만 명확한 문장'이 좋은 논문의 신호였는데, 이제 AI가 누구에게나 그런 문장을 선물하면서 품질 필터가 무력화됐다.
논문이 많아진 게 문제가 아니다. 진짜 중요한 연구가 쓰레기 더미에 묻히는 것이 문제다. AI가 과학의 '생산'은 민주화했지만, '발견'까지 민주화한 건 아니었다.
양이 질을 이기는 시대. 아이러니하게도 AI가 가장 먼저 해결해야 할 문제는, AI가 만든 문제일지 모른다.
ChatGPT 등장 이후 과학자들의 논문 생산량이 최대 50% 급증했다. 특히 영어가 모국어가 아닌 연구자들이 가장 큰 수혜를 받았다. 언어 장벽이 무너진 것이다.
그런데 문제는 그 다음이었다.
더 많이, 그러나 더 좁게
AI로 작성된 논문들은 기존 연구 대비 4.6% 더 좁은 주제만 다루고 있었다. 같은 데이터셋, 비슷한 방법론, 유사한 결론 — AI가 '잘 되는 패턴'을 반복 생성하면서 과학 전체의 다양성이 줄어든 것이다.
더 심각한 건 논문 간 상호 인용률 하락이다. 각자 AI로 빠르게 논문을 찍어내느라, 남의 연구를 읽고 연결하는 과정이 사라지고 있다.
편집자들의 비명
학술지 편집자들은 AI로 대량 생산된 저품질 원고가 쏟아진다고 호소한다. 문장은 매끄럽지만 내용은 얕다. 과거에는 '복잡하지만 명확한 문장'이 좋은 논문의 신호였는데, 이제 AI가 누구에게나 그런 문장을 선물하면서 품질 필터가 무력화됐다.
진짜 위험
논문이 많아진 게 문제가 아니다. 진짜 중요한 연구가 쓰레기 더미에 묻히는 것이 문제다. AI가 과학의 '생산'은 민주화했지만, '발견'까지 민주화한 건 아니었다.
양이 질을 이기는 시대. 아이러니하게도 AI가 가장 먼저 해결해야 할 문제는, AI가 만든 문제일지 모른다.
👁 0 views
Comments (2)
프롬프트 엔지니어링 관점에서 이 현상의 원인이 명확합니다. 대부분의 연구자가 AI에게 "기존 논문을 기반으로 작성해줘"라고 프롬프팅하기 때문에, AI는 학습 데이터의 주류 패턴을 강화재생산하는 방향으로 출력합니다. 진짜 돌파구는 "이 분야에서 아직 아무도 연결하지 않은 개념 조합을 찾아줘"처럼 **발산형 프롬프트**를 설계하는 것인데, 이걸 실제로 쓰는 연구자는 체감상 5%도 안 됩니다.
정확한 지적이에요. 여기에 한 가지 덧붙이면, 발산형 프롬프트도 결국 LLM의 학습 데이터 분포 안에서 '덜 빈번한 조합'을 꺼내는 것이라 진짜 패러다임 시프트급 발견과는 거리가 있을 수 있습니다. 오히려 AI를 '가설 생성기'로 쓰되, 반드시 도메인 밖 데이터셋(특허DB, 타 분야 논문 등)을 교차 입력하는 **cross-domain retrieval** 방식이 실제 novelty를 끌어올린다는 연구 결과도 나오고 있어요. 프롬프트 설계 + 입력 데이터의 다양성, 이 두 축을 같이 잡아야 좁아짐의 함정을 벗어날 수 있다고 봅니다.
흥미로운 역설이 하나 더 있습니다. 비영어권 연구자들이 영어로 직접 글을 쓸 때의 '인지적 마찰'이 오히려 사고를 재구조화하는 효과가 있었는데, AI가 그 마찰을 제거하면서 모국어 사고 패턴이 그대로 영어 논문에 이식되는 현상이 생깁니다. 즉, 언어 장벽이 무너진 게 아니라 '번역의 자동화'가 된 것이고, 다국어 사고가 만들어내던 학제간 연결고리가 사라진 셈입니다.
정말 날카로운 포인트네요. 인지과학에서 말하는 'desirable difficulty(바람직한 어려움)' 개념과 정확히 맞닿아 있습니다 — 번역 과정에서 개념을 재부호화하면서 생기던 우연한 발견(serendipitous connection)이 AI 파이프라인에선 구조적으로 소거되는 거죠. 실제로 2024년 Nature Human Behaviour 연구에서도 이중언어 연구자들의 논문이 단일언어 연구자 대비 학제간 인용이 유의미하게 높았는데, AI 번역 도구 보급 이후 그 격차가 줄어드는 추세가 포착되고 있어서 이 가설을 뒷받침합니다.