" D.I.A.+ 알고리즘에서는 검색 의도에 맞는 문서를 먼저 보여줍니다. "
" 분석된 의도는 사용성과 가독성을 높이기 위해서 일부 검색 결과의 스니펫에서도 함께 활용됩니다. "
" 의도가 적용된 통검 검색결과에서 기존 대비 평균 18.3% 더 높은 반응이 확인되었습니다. "
현재 VIEW 검색에는 크게 2가지 알고리즘이 적용되어 있습니다.
바로 출처의 신뢰도를 분석하는 C-Rank (Creator Rank) 와 문서의 정보성을 분석하는 D.I.A.(Deep Intent Analysis) 알고리즘 입니다.
이러한 알고리즘은 '좋은 출처'의 '좋은 문서'를 더 잘 노출하기 위해 꼭 필요합니다.
즉, 검색 이용자의 만족도를 높이기 위해, '신뢰도가 높다고 판단된' 출처에서 '더 많은 정보를 포함하고 있는' 문서를 우선 노출할 수 있는 검색 피처(feature)들이 발굴되어 알고리즘에 활용되고 있습니다.
처음에 잘 동작하던 알고리즘도 새로운 데이터 환경과 니즈에 발맞춰 빠르게 진화하지 못하면 사용자들의 눈높이에 맞는 만족스러운 검색 결과를 제공하기가 점점 더 어려워집니다.
그래서 각 알고리즘은 새롭게 수집되는 다양한 검색 피처들과 결합해 계속 진화를 거듭하고 있습니다.
D.I.A. + (다이아 플러스) 란?
D.I.A. (다이아, Deep Intent Analysis)란, 네이버의 데이터를 기반으로 키워드별로 사용자들이 선호하는 문서들에 대한 점수를 랭킹에 반영한 모델입니다.
기존 D.I.A. 모델에서 사용자의 구체적인 의도에 맞는 더 정확한 진성 정보와 출처를 찾아 내기 위해, 딥 매칭과 패턴 분석, 동적 랭킹 등에 대한 새로운 연구들이 반영되면서 D.I.A.+ 로 한층 업그레이드되었습니다.
< D.I.A. + 알고리즘 >
[D.I.A.+ 의 알고리즘]
- 질의 의도 분석기 : 의미 기반 클러스터링과 학습을 통해 질의 패턴을 분석합니다.
- 문서 패턴 분석기 : 문서의 구조, 본문 텍스트, 이미지 정보 등으로부터 추출된 새로운 패턴 피처들을 D.I.A.+ 랭킹 로직에 활용합니다.
- 문서 확장 모듈 : 의미적으로 대체가 될 만한 단어를 문서에 추가함으로써 문서와 검색어의 매칭 확률을 높이고 검색품질을 높이고 있습니다.
>> 기술소개 자세히
- D.I.A.+ 랭킹 : 다양해진 패턴 피처들과 사용자 피드백을 통해 질의 의도에 적합한 문서인지 유동적으로 파악해 다채로운 검색 결과를 제공합니다.
- 피드백 반영 : 이러한 알고리즘은 계속 새로운 데이터를 반영해 학습되고 개선되고 있습니다.
업그레이드된 D.I.A.+ 에서 추가로 분석되는 요소
- VIEW 검색에서 사용자들이 자주 검색하는 질의에 대한 분석이 업그레이드됩니다.
네이버 통합검색에는 다양한 검색결과들이 제공되는데요, 특히, VIEW 검색은 사용자들의 경험, 의견, 리뷰를 잘 보여줄 수 있도록 알고리즘이 적용되어 있습니다.
D.I.A.+ 에서는 경험, 의견, 리뷰를 찾고자 하는 사용자 질의에서 더 좋은 검색결과를 제공하기 위해 기존 보다 강화된 질의 의도 분석 결과가 사용됩니다.
즉, '무엇을 찾는 질의인가 - 그 질의가 VIEW 검색에서 다루는 경험, 의견, 리뷰에 포함되는가' 라는 사용자들의 질의 의도가 추가로 분석됩니다.
일례로, VIEW 검색에서는 정해진 정가가 없는 싯가(예. 비행기표 가격, 수산물 싯가, 핸드폰 수리비 등)나 다양한 서비스 옵션에 따른 경험적 가격(예. 입주청소 비용, 이사업체 가격, 한달여행 경비 등)을 포함한 정보를 찾는 다양한 사용자 질의 패턴이 많습니다.
분석된 관련 질의 패턴만 수 천개에 달하고, 블로그 문서에서 발견된 가격 포함 정보가 전체 문서의 약 20% 정도를 차지할 정도로 많이 생산되고 있습니다.
이렇게 적용된 다양한 의도들은 통검에서 기존 대비 평균 18.3% 더 높은 사용자 반응이 확인되었으며, 특히, 사용자의 상세한 서비스 경험이 많이 담긴 시공 비용이나 시술 비용 등의 문서에서는 50% 이상 더 높은 효과를 보여주고 있습니다.
- 분석된 질의 의도에 맞는 문서를 찾을 때는 더 까다로워집니다.
'문서의 제목과 설명만 보고 클릭했더니, 실제 원하는 정보는 없는 낚시성 글이였다'라는 사용자들의 리포팅이 많이 접수되고 있습니다.
이에 D.I.A.+에서는 더 구체적이고 정확한 내용을 포함한 믿을 수 있는 문서와 출처를 찾기 위해 다양한 기술을 적용하고 있습니다.
D.I.A.+ 에서는 추가로 분석된 질의 의도에 맞춰, 각 문서에서 해당 내용이 포함되어 있는지까지 판별해 기존 알고리즘을 업그레이드했습니다.
이는 단순히 해당 정보 포함 여부 뿐만 확인하는 것이 아니라, 기존의 다양한 신뢰도 feature 들과 결합해 까다로운 기준으로 적용됩니다.
현재 이러한 검색 feature는 의도에 맞는 '구체적인 정보'를 찾을 때, 진성의 '맛집' 후기를 찾을 때, 다양한 '추천' 콘텐츠를 찾을 때 등 폭넓게 활용될 예정입니다.
검색어와 매칭된 결과를 제공하는 것을 넘어서 사용자 의도를 딥하게 분석하고 더 적합한 문서들을 선별할 수 있는 AI 검색 기술로 진화하고 있으니 많이 기대해 주세요.
[후기 작성 시, 주의를 당부드립니다]
최근에도 상품이나 맛집 후기 작성 시 대가성을 표시하지 않은 경우가 많은데요, 이 경우 신고/모니터링/알고리즘 등에 의해 강한 제재를 받으실 수 있습니다.
>> 업체로부터 물품/서비스/기타 금전적 지원을 받았다면 모든 글에 명확하게 표기해야 합니다.
새로운 스니펫을 제공하는 D.I.A.+
D.I.A.+ 알고리즘에서 분석된 정보들은 사용성과 가독성을 높이기 위해서 일부 검색 결과의 스니펫에서도 함께 활용됩니다.
이러한 스니펫 노출은 단순한 특정 패턴만을 분석하는 것은 아니며, 다양한 기준에서 분석된 내용들을 알고리즘이 종합적으로 판단해 자동 노출됩니다.
이를 통해, 검색 사용자들에게는 더 정확한 검색 결과를 제공하고, 더 좋은 문서를 작성한 창작자들에게는 더 매력적인 검색 노출의 기회를 가질 수 있을 것으로 기대됩니다.
----
AI 알고리즘은 계속 데이터를 학습하고 피드백을 반영하는 과정이 쌓여서 시간이 지날수록 더 개선된 검색 결과를 제공할 수 있습니다.
당장은 완벽해 보이지 않을 수 있지만, 더 좋은 검색 결과를 만들어 가는 과정으로 지켜 봐주시길 부탁드립니다.
검색 서비스도 다양한 데이터가 AI 기술과 결합해 더 완결성을 갖춘 검색 결과를 제공할 수 있는 시대가 되었습니다.
제한된 공간과 한정된 시간에서만 소비되는 검색 결과에서 더 나아가, 정확한 예측과 무한한 영감을 주는 새로운 검색 결과를 제공하기 위해 계속 노력하겠습니다.
감사합니다.
'기억' 카테고리의 다른 글
크런치 / 크런치 모드가 뭔가요 ? (0) | 2020.11.24 |
---|---|
<2020년 블랙프라이데이 준비> 낙타최저가 아이봤니? 낙타 최저가가 도대체 뭐임? (0) | 2020.11.24 |
쪽지가 도착했습니다 빨리 확인해주세요.SWF / *.mp3 (0) | 2020.11.24 |
은혜아니면악보 (0) | 2020.11.24 |
루니오가 누구이며? 넷카마는 무슨뜻일까? (0) | 2020.11.24 |
[호구테스트] 호구성향테스트 (0) | 2020.11.24 |
3차 재난지원금은 과연 지급될까? (0) | 2020.11.24 |
2020년 종부세가 뭐고 어떻게 부과되는 걸까 ? 2021년 종합부동산세 (0) | 2020.11.24 |