【53.rtb667.top】
오션슬롯 먹튀릴게임 다빈치릴게임 코리아바다이야기게임다운로드
야마토 동영상 ☎ 79.rtb667.top ☎ 바다이야기 하는법
야마토 동영상 ☎ 98.rtb667.top ☎ 바다이야기 하는법
야마토 동영상 ☎ 89.rtb667.top ☎ 바다이야기 하는법
야마토 동영상 ☎ 68.rtb667.top ☎ 바다이야기 하는법
메가슬롯 블랙홀3D 릴게임 모바일릴게임 용의 눈 게임 파칭코게임 바다이야기하는법 오리지날황금성9게임 오리지널야마토 야마토게임장주소 키지노릴게임 슬롯머신 원리 오리지날바다 황금성온라인 바다이야기 모바일게임 신천지게임 하는곳 야마토2동영상 야마토게임공략 법 릴게임 사이트 도메인 일본빠찡꼬 모바일야마토5게임 릴게임안전사이트 릴게임놀이터 슬롯모아 바다이야기공략법 슬롯머신 확률 메이저릴게임사이트 야마토게임다운 오리 지날 바다 바다이야기 먹튀 신고 먹튀 피해 복구 슬롯사이트 바다이야기배당 바다이야기 게임 pc빠찡꼬게임 슬롯게시판 바다이야기 도박 한게임바둑이 릴게임공략법 릴황 금성 온라인 슬롯 하는 법 바다이야기 예시 바다이야기 pc버전 다운 오션파라다이스예시 모바일신천지 오션파라 다이스게임다운로드 야마토게임2 강시 오션파라 다이스하는방법 슬롯 머신 제작 온라인빠찡고 바다이야기 슬롯 신천지릴게임장주소 체리마스터 릴게임 알라딘설명 슬롯무료게임 최신 릴게임 프라그마틱 순위 다빈치 릴게임 황금성온라인주소 10원 야마토게임 신천지게임 모바일 바다이야기 슬롯머신추천 야마토3게임다운로드후기 신규슬롯사이트 인터넷야마토 야마토3게임 다운로드 하기 황금성하는법 오션파라다이스다운 바다게임사이트 10원야 마토 야마토하는곳 바다이야기슬롯 무료백경 온라인 슬롯 머신 게임 알라딘게임랜드 황금성3게임공략법 오리 지날야마토2게임 바다이야기pc 신천지게임 하는방법 다빈치게임 손오공 매장판황금성 모바일 바다 이야기 다운 일본빠찡꼬 야마토온라인주소 야마토오락실게임 손오공예시 야마토 연타 릴게임황금포카성 릴게임 다빈치 슬롯버프 보물섬릴게임 용의 눈 게임 무료카지노게임 바다이야기 무료 알라딘바로가기 온라인빠찡고 알라딘 게임 다운 슬롯머신 확률 무료게임다운로드 온라인 슬롯 배팅법 황금성게임다운로드 야마토하는곳 온라인룰렛 무료야마토릴게임 야마토게임방법 바다이야기 모바일 무료슬롯게임 황금성게임 안전 검증 릴게임 모바일신천지모바일 바다신2영상 신천지 게임 공략법 신천지인터넷게임 야마토게임2 프라그마틱 무료체험 슬롯 무료스핀 온라인예시게임 야마토 2 다운로드 온라인게임 바다슬롯 먹튀 프라그마틱 슬롯 사이트 뽀빠이놀이터릴게임 777 무료 슬롯 머신 인공지능(AI) 시대 여러 산업군에서 대규모 언어모델(LLM) 벤치마크 테스트를 자체 개발하는 움직임이 나오는 가운데 언론계에서도 뉴스 업종에 특화한 대응이 필요하다는 지적이 제기되고 있다. 언어모델의 광범위한 지식이나 추론 능력 등을 평가하는 일반적인 벤치마크는 특정 산업군, 즉 언론 영역의 실제 운영 환경에서 필요를 반영하지 못해 한계가 명확하다는 이유에서다.
미국 컬러비아대 저널리즘대학원에서 발행하는 ‘컬럼비아저널리즘리뷰’(CJB)는 최근 “언론인들을 위한 자체 벤치마크 테스트가 필요하다”(‘Journalists Need Their Own Benchmark Tests for AI Tools’) 기사를 통해 “AI 기업들이 사용하는 성능 테스트는 뉴스룸에서 중요한 요소를 측정하지 못한다
서민저금리대출 ”고 지적했다.
'언론인들을 위한 자체 AI 벤치마크 테스트가 필요하다'고 촉구한 컬럼비아저널리즘리뷰 기사.
기사는 AI 기업들이 LLM 성능 평가에 사용하는 벤치마크 테스트들이 모델의 전반적 정확도나 실제 역량을
스마트폰 공인인증서 향상시키기보다 “시험을 잘 보는 능력을 훈련시키고 있다”면서 “연구자들은 LLM 평가방식에 대한 근본적인 재검토를 촉구하고 있다”고 적었다. 이에 따라 광범위한 벤치마크 대신 소규모 작업 중심(task-based) 평가가 제안되고 있고, 실제 의학이나 법률, 교육, 금융 등 “위험도가 가장 높은 영역”에서 분야별 벤치마크 구축 움직임도 나오고 있다고도 설명
신협 이율 했다.
같은 맥락에서 저널리즘 분야 시도를 소개하며 기사는 “대부분의 AI 시도는 기자나 뉴스 수용자를 염두에 두고 설계되지 않았으며, AI 기업들이 사용하는 벤치마크는 뉴스룸에서 중요한 요소를 측정하는 경우가 거의 없다”고 했다. “그 결과 기자, 편집자, 팩트체커들은 끊임없이 진화하는 모델이 자신들의 필요에 적합한지, 그 결괏값이 정확
1억모으기 적금 성, 투명성, 책임성, 객관성 같은 저널리즘 가치와 어떻게 부합하는지에 대한 가시성을 확보하지 못하고 있다”는 것이다.
구체적인 시도 사례로 CJB는 미국 노스웨스턴대 컴퓨테이셔널 저널리즘 연구소 소장 니콜라스 디아코풀로스(Nicholas Diakopoulos)가 주도하는 ‘뉴스룸 내 생성형 AI’(Generative AI in the N
MI(모기지보험)대출 ewsroom) 프로젝트를 소개했다. 뉴스룸을 위한 벤치마크 테스트 개발을 추진 중인 프로젝트는 AI 기업이 사용 및 제시하는 벤치마크와 관련해 “이 점수들 중 저널리즘에 어떤 모델을 언제 사용해야하는지 알려주는 게 있나”란 문제의식에 기반해 있다.
이에 따라 연구팀은 이번 여름 23명의 기자들과 ‘뉴스 벤치마크’의 가능성을 모색하는 워크숍을 진행하며 정보 추출(information extraction), 의미론적 검색(semantic search), 요약(summarization), 콘텐츠 변환(content transformation), 배경 조사(background research), 팩트체킹(fact-checking) 등 6가지 핵심 활용 사례를 도출했다.
CJB는 “편집 환경의 광범위한 차이로 인해 뉴스룸 업무를 벤치마크로 일반화하는 데 상당한 어려움이 있음을 확인했다. 공개 데이터셋 구축은 기밀성과 리소스 측면에서 과제도 낳았다”면서도 “그럼에도 강력한 평가는 막대한 자원을 필요로 하는 만큼 업계가 협력해 인프라를 공유하고, 표준을 개발하며, 도구를 독립적으로 테스트하는 것은 필수적”이라고 적시했다.
이어 일반적인 벤치마크가 항상 성능을 분명히 예측하는 것은 아닌 만큼 “개별 뉴스룸은 가장 중요하게 여기는 업무에 대해 AI 도구를 직접 평가하고 편집 우선순위를 반영해 ‘실패 테스트’(fail tests)를 설계해야 한다"고 덧붙였다.
미국 노스웨스턴대에서 진행 중인 '뉴스룸 내 생성형 AI' 프로젝트. 연구진은 저널리즘에 유용한 LLM 벤치마크 테스트 툴 개발을 추진하고 있다.
CJB는 업계 차원의 검토가 필요한 부분으로 ‘챗봇이 뉴스 콘텐츠를 제공하는 방식’에 대해서도 언급했다. 최근 주요 언어모델들이 인용한 전체 링크 출처 중 27%가 저널리즘과 관련이 있었고, 시의성 있는 질의에선 이 비율이 절반 수준까지 올라갔다는 연구결과가 나와 화제가 됐는데 “언론 콘텐츠가 LLM 사용자에게 자주 노출됨에도 불구하고 ‘챗봇이 보도를 정확히 재현하는지, 출처를 올바르게 인용하는지’, ‘기사를 재구성할 때 충분한 맥락을 제공하는지’에 대해선 거의 알려져 있지 않”고, 올해 BBC의 자체 테스트에선 “AI 툴이 종종 기사 내용을 왜곡한다는 사실이 발견되기도 했다”는 것이다. (관련기사: <"AI가 내놓는 답변, '저널리즘 콘텐츠' 크게 의존">)
이 같은 작업과 관련해 CJB는 “AI 모델에 대한 제3자 평가는 단순한 기술적 문제가 아니라 책임성의 문제다. 독립적이고 투명한 평가가 없다면 뉴스기관들은 기업의 주장으로 인해 장단점이 가려진 도구를 채택할 위험에 처한다”며 “명확한 기준을 수립하는 것은 AI의 저널리즘적 활용이 더 책임감 있고 신뢰할 수 있도록 하는 데 도움이 될 수 있다”고 강조했다.