자유 게시판
프로필 이미지
[레벨:18]챠우
read 4181 vote 0 2016.10.17 (11:51:59)

그간 우리 연구실에서 인공지능 번역기를 연구하면서 가장 큰 이슈는
어법에 맞는 말을 하는 머신이었다.
구글의 번역기나 기타 번역기들은 기본적으로 말을 할 줄 몰랐다.
그냥 데이터에 기반해서 갖다 붙이는 식.
그 결과물들은 단어의 뜻은 대충 맞지만 기본적인 어법조차 성립이 안되는 것들이었다.

번역기라는 것이 기본적으로 말할줄 안다는 개념이 필요했지만,
글로벌 언어인 영어의 어순과 지역어인 한국어의 어순에 차이가 있음에도 불구하고
인터넷이 영어권 중심이다보니 말할줄 아는 능력자체가 크게 부각될 필요가 없었다.
같은 어순끼리는 데이터 기반만으로도 쉽게 번역이 가능하므로.

근데 네이버가 말할 줄 아는 머신을 만들어냈다.
사실 현대 컴퓨터 기술로 영한/한영 번역기를 만들지 못한다는 게 더 이상할 지경이었는데,
알파고가 뜨자 상황이 달라졌다.

이제 남은 인공지능의 분야는 지식의 체계화에 따른 메모리 최적화 기술이다.
네이버 번역기나 알파고는 그 구현되는 능력에 비해 지나치게 큰 머신파워를 필요로 하는데,
머신러닝의 근본적인 발상전환이 필요한 때가 됐다는 것.
이것은 기본적으로 인공지능의 구동 시스템 자체가 바뀌어야 하는 것이다.

http://labspace.naver.com/nmt/



프로필 이미지 [레벨:30]ahmoo

2016.10.17 (11:59:06)

와우!

프로필 이미지 [레벨:7]風骨

2016.10.17 (12:26:24)

비교적 쉬운 말들은 대체로 괜찮지만 조금이라도 전문적인 내용은 아직 멀었군요.


적당히 알아서 단어도 없애버리는 것을 보니 상당히 유연하군요.


영한 번역.jpg 한영 번역기.jpg

첨부
프로필 이미지 [레벨:18]챠우

2016.10.17 (13:07:49)

중요한 것은 "말하는 법"을 쓴다는 것입니다. 이게 기존 번역기와 가장 큰 차이점입니다. 일단 말하는 구조를 세팅하고 빈칸을 만든 이후 빈칸에 필요한 정보를 탐색하는 방식을 쓰는 거죠. 

그 다음에 중요한 탐색의 원칙이 있으나, 네이버가 아직 구현하지 못했으므로, 온라인에서 언급하지 못하는 부분도 있습니다.

프로필 이미지 [레벨:11]까뮈

2016.10.17 (13:44:54)

웃기고 있네-> It's funny

지랄하고 있네->That's bullshit 


멋지네요.

프로필 이미지 [레벨:11]까뮈

2016.10.17 (13:52:00)

아침에 일어나서 이 딲고 밥을 먹는다.

I wake up in the morning and eat breakfast.


이 딲는 건 빼네요.중요한 건 밥을 breakfast 로 번역.

프로필 이미지 [레벨:18]챠우

2016.10.17 (14:00:03)

'아침에 일어나서 이를 닦고 밥을 먹는다.'로 돌리면 제대로 나옵니다.

> I wake up in the morning and brush my teeth and eat breakfast.


결론 : 특이한 말쓰임새가 사용자들에 의해 업데이트가 이뤄지면 이상한 말도 잘 번역시킬 수 있을 겁니다.

프로필 이미지 [레벨:11]까뮈

2016.10.17 (14:06:21)

정말 그렇게 번역되네요.하여간 대단.

프로필 이미지 [레벨:18]챠우

2016.10.17 (13:53:21)

한편 하사비스는..(아래 내용은 셀에 올라온 기사를 네이버 번역기(머신)와 챠우(인간) 번역을 비교한 것입니다.)

 

http://www.cell.com/trends/cognitive-sciences/fulltext/S1364-6613(16)30043-2

 

 

What Learning Systems do Intelligent Agents Need? Complementary Learning Systems Theory Updated

머신 번역 : 지능형 에이전트가 필요한 학습 시스템은 무엇입니까? 보완 학습 시스템 이론이 업데이트됨

 

We update complementary learning systems (CLS) theory, which holds that intelligent agents must possess two learning systems, instantiated in mammalians in neocortex and hippocampus.

머신 번역 : 우리는 지능형 학습 시스템( CLS)이론을 업데이트하고, 지능형 에이전트는 두개의 학습 시스템을 보유하고 있는데, 이는 전두엽 피질과 해마에서 2개의 학습 시스템을 소유하고 있다는 것을 의미한다.

챠우 번역: 우리는 상호보완적인 학습 시스템(CLS)을 업데이트 하는데 그 시스템은 지능 에이전트가 반드시 두개의 학습 시스템을 가져야 한다는 것을 의미하며, 그것은 예를 들면 포유류에서 신피질과 해마이다.

 

The first gradually acquires structured knowledge representations while the second quickly learns the specifics of individual experiences.

머신 번역 : 첫번째 단계는 두번째로 빠르게 요약된 지식을 획득하는 동시에 두번째 경험을 통해 개별적인 경험을 습득한다.

챠우 번역 : 첫번째 단계는 구조화된 지식 표상을 점진적으로 획득하는 반면 두번째 단계는 개별적 경험의 세부내용을 빠르게 배운다.

 

We broaden the role of replay of hippocampal memories in the theory, noting that replay allows goal-dependent weighting of experience statistics.

머신 번역 : 우리는 이론에서 다시 재연할 수 있다는 것을 다시 한번 강조하면서, 해마의 추억의 재연을 다시 한번 강조한다.

챠우 번역 : 우리는 학설에서의 해마기억 반복(재연)의 역할을 확장하며, 재연은 경험통계의 결과의존가중치를 허용한다는 것을 강조한다.

 

We also address recent challenges to the theory and extend it by showing that recurrent activation of hippocampal traces can support some forms of generalization and that neocortical learning can be rapid for information that is consistent with known structure.

머신 번역 : 200자 넘어서 네이버 번역기로는 번역 불가.

챠우 번역 : 우리는 또한 학설(이론)에 대한 최근의 도전을 말하고, 그리고 해마를 추적한 회귀활성이 일반화의 형식을 도와줄 수 있음을 보여줌으로써 그것을 확장하며, 그러므로 신피질의 학습은 정보에 빨라질 수 있으며, 그 정보는 지식구조와 일치한다.

 

Finally, we note the relevance of the theory to the design of artificial intelligent agents, highlighting connections between neuroscience and machine learning.

머신 번역 : 마지막으로, 우리는 인공 지능과 기계 학습 사이의 연관성을 강조하는 인공 지능 요원의 설계에 관한 이론을 주목한다.

챠우 번역 : 마지막으로, 우리는 인공지능의 디자인에 대한 학설의 연관성을 주목하며, 그것은 뇌과학과 머신러닝 사이의 연결을 강조한다.

 

Trends

Discovery of structure in ensembles of experiences depends on an interleaved learning process both in biological neural networks in neocortex and in contemporary artificial neural networks.

머신 번역 : 경험에 있어서의 구조물의 발견은 대뇌 피질과 현대적인 인공 신경 네트워크에 있는 생물학적 신경 조직 모두에 있어서 interleaved 학습 과정에 달려 있다.

챠우 번역 : 경험의 조화에서 구조의 발견하는 것은 인터리브(상호 배치: 하드 디스크의 섹터 조정, 주기억 장치의 복수 부분화로 데이터 검색을 효율화하는 것, 책에 메모지를 끼워넣는 개념) 러닝 프로세스에 의존하며, 그것은 신피질의 생물학적 신경망과 현대의 인공 신경망의 양측에 모두 해당된다.

 

Recent work shows that once structured knowledge has been acquired in such networks, new consistent information can be integrated rapidly.

머신 번역 : 최근의 작업은 구조화된 지식이 그러한 네트워크에서 획득된 적이 있다는 것을 보여 주고 있으며, 새로운 일관된 정보는 빠르게 통합될 수 있다.

챠우 번역 : 최근의 작업은 한때(과거에) 구조화된 지식은 그러한 네트워크에서 획득된다는 것을 보여주며, 새로 이루어진 정보는 빠르게 통합될 수 있다.

 

Both natural and artificial learning systems benefit from a second system that stores specific experiences, centred on the hippocampus in mammalians.

머신 번역 : 자연과 인공 학습 시스템은 두번째 시스템에서 특정한 경험을 하는데,이는 해마의 해마상 융기를 중심으로 한 것이다.

챠우 번역 : 자연적인 것과 인공적인 학습 시스템의 모두는 두번째 시스템에서 이득을 얻는데, 그것은 특정 경험을 저장하며, 포유류의 해마의 중심에 위치한다.

 

Replay of experiences from this system supports interleaved learning and can be modulated by reward or novelty, which acts to rebalance the general statistics of the environment towards the goals of the agent.

머신 번역 : 200자 넘어서 네이버 번역기로는 번역 불가.

챠우 번역 : 이런 시스템에서 경험의 재현은 인터리브 학습을 지탱하며, 보상과 새로운 경험에 의해 묘듈화될 수 있고, 그것은 에이전트의 목표에 대한 환경의 일반적인 통계를 재-밸런스하도록 작동한다.

 

Recurrent activation of multiple memories within an instance-based system can be used to discover links between experiences, supporting generalization and memory-based reasoning.

머신 번역 : 다중 경로 시스템 내에서 다중 기억 장치의 다중 기억 장치를 활성화하는 것은 경험과 일반화, 일반적인 추론을 뒷받침하는 링크를 발견하는 데 사용될 수 있다.

챠우 번역 : 사례기반 시스템을 가진 다중 기억의 회기 활성은 경험 사이의 링크를 찾는데 사용될 수 있고, 그것은 기억 기반 추론과 일반화를 뒷받침한다.

프로필 이미지 [레벨:18]챠우

2016.10.17 (14:11:19)

잘 생각해보세요. 여기에 몇가지만 추가되면 번역기는 통계기반으로 대충 완성될 수 있습니다. 

네이버가 쓰는 방식은 무식한 것이지만 강력한 컴퓨팅 파워로 그 무식함을 떼울 수 있습니다. 알파고가 그러했듯이요.


물론 그 이상을 가려면 '하사비스가 연구하는 구조화된 지식'과 '구조론적 사고법'에 주목해야 합니다. 

프로필 이미지 [레벨:18]챠우

2016.10.17 (18:24:23)

이하는 아무님이 시사리트윗에 올렸던 기사를 머신번역과 챠우번역으로 비교번역한 것으로 개인의 연구 목적으로 남기는 글입니다.

 

http://www.foxnews.com/world/2015/11/13/...caust.html

 

A well-known 87-year-old German Neo-Nazi grandmother has been sentenced to 10 months in prison after being found guilty of denying the Holocaust.

머신 번역 : 저명한 87-year-old 독일 태생의 할머니는 홀로코스트를 부인한 죄로 유죄 판결을 받은 후 10개월 징역형을 선고 받았다.

챠우 번역 : 잘 알려진 87-year-old의 독일 신나치 할머니는 홀로코스트를 부정하는 죄가 발견된 이후에 징역 10개월을 선고 받았다.

 

Bild newspaper reported Friday that Ursula Haverbeck, dubbed the “Nazi grandma” in the German media, said she will appeal Thursday's Hamburg state court verdict.

머신 번역 : 독일 언론에 의하면, 독일 언론에서 "나치 할머니"라고 불리는 Bild Haverbeck가 목요일에 "Nazi state"판결을 받았다고 한다.

챠우 번역 : 빌드 뉴스는 Ursula Haverbeck(독일 미디어에서 '나찌 할머니'라는 별명을 가진)는 목요일의 호놀룰루 법원 판결에 항소한다고 말했다는 것을 금요일에 보도했다.

 

Haverbeck was charged earlier this year after giving an interview outside the trial of former SS Sgt. Oskar Groening claiming Auschwitz wasn't a death camp.

머신 번역 : Haverbeck는 올해 초 전 SS하사관의 심문을 받은 후 올해 초에 기소되었다. 아우슈비츠 수용소라고 주장하는 오스카 상은 죽음의 수용소가 아니었다.

챠우 번역 : Haverbeck은 이전 SS Sgt 법정 바깥으로 인터뷰를 제공한 이후 올초에 고발되었다. Oskar Groening은 아우슈비츠는 죽음의 캠프가 아니었다고 주장한다.

 

When she challenged the presiding judge in Hamburg to prove it was, Bild reports that he said he wouldn't debate someone who "can't accept any facts."

머신 번역 : 그녀는 클라크 판사가 그것을 증명할 것임을 증명하기 위해, 자신이 어떤 사실을 받아들일 수 없다는 것을 누군가와 논의할 수 없다고 주장했다.

챠우 번역 : 그녀는 함부르크에 있는 수석판사에게 그게 언제인지를 증명하는 것에 이의를 제기했고, 빌드지는 어떤 사실도 받아들일 수 없다는 누군가와도 논쟁하지 않겠다고 보도했다.

 

“Neither do I have to prove to you the world is round," Magistrate Bjoern Joensson said.

머신 번역 : "저는 여러분께 세계가 둥글다는 것을 증명해야 합니다,"라고 Magistrate Bjoern Joensson는 말했다.

챠우 번역 : "나는 당신에게 세계가 둥글다는 것을 증명할 필요도 없다."라고 Magistrate Bjoern Joensson는 말했다.

 

In his ruling, Joensson said, according to Agence France-Presse, “It is deplorable that his woman, who is still so active given her age, uses her energy to spread such hair-raising nonsense.”

머신 번역 : 그의 말에 따르면 Joensson 씨는 자신의 나이에 비해 아직도 활발하게 활동하고 있는 여성들이 그러한 소름 끼치는 헛소리를 퍼뜨리기 위해 에너지를 사용하는 것은 개탄스러운 일이라고 말했다.

챠우 번역 : 그의 판결에서, Joensson, Agence France-Presse에 따르면, " 그의 여자가, 여전히 나이에 비해 활동적인, 그녀의 에너지를 그런 소름끼치는 헛소리를 퍼뜨리는데 사용하는 것은 개탄스럽다."라고 말했다

 

“She is a lost cause,” he added, AFP reported.

머신 번역 : "그녀는 실종된 원인입니다,"라고 그는 덧붙였다.

챠우 번역 : "그녀는 잃어버린 원인입니다"라는 말을 그가 덧붙였다고 AFP가 보도했다.

 

Haverbeck is a notorious extremist who was once chaired a far-right trainng center shut down in 2008 for spreading Nazi propaganda, according to AFP. She has a rap sheet and a suspended sentence for sedition.

머신 번역 : AFP통신에 따르면, AFP통신은 한때 나치의 선전 선동을 감행한 바 있는 2008년 극단 주의자들을 위한 극우주의 중도 좌파 주의자로 악명 높은 극단적인 극단주의 자이다. 그녀는 폭동 선동으로 전과가 있다.

챠우 번역 : Haverbeck은 한때 far-right 트레이닝 센터의 장을 맡았던 악명높은 극단주의자이며, 그 센터는 2008년에 나치 프로파간다를 퍼뜨려 문을 닫았다고 AFP가 말했다. 그녀는 폭동선동으로 전과 기록과 집행유예를 가지고 있다.

 

Haverbeck was arrested on hate speech charges in June, according to reports.

머신 번역 : 보도에 따르면, 6월에 있었던 혐오스러운 말투로 체포되었다고 한다.

챠우 번역 : 보도에 따르면, Haverbeck 6월에 혐오발언기소로 체포되었다고 한다.

 

Groening, who gave lengthy testimony on how the death camp functioned, was convicted of 300,000 counts of accessory to murder for the Jews killed while he was there.

머신 번역 : 사망 캠프가 어떻게 운영되었는지에 대한 장황한 증언을 한 것은 유태인들이 그곳에 있는 동안 살해된 유태인들을 살해한 혐의로 30만건의 혐의로 유죄 판결을 받았다.

챠우 번역 : Groening(그는 죽음의 캠프가 어떻게 작동했는지에 대해 긴 증언을 했다)은 그가 그곳에 있던 동안 살해된 유태인 살인에 대한 방조죄 30만건으로 판결을 받았다.

 

The charges against Groening related to a period between May and July 1944 when hundreds of thousands of Jews from Hungary were brought to the Auschwitz-Birkenau complex in Nazi-occupied Poland. Most were immediately gassed to death.

머신 번역 : 수천명의 유대인들이 폴란드의 Auschwitz-Birkenau에 이르기까지, 19445월과 7월 사이에 에티오피아에서 수백만명의 유대인들과 관련되어 있던 시기와 관련된 혐의로 기소되었다. 대부분은 즉시 사형에 처해졌다.

챠우 번역 : Groening에 대한 기소는 19445~7월 사이의 기간과 관련되어있으며, 당시에 헝가리에서 온 수백만명의 유태인이 나치가 점령한 폴란드에 있는 아우슈비츠-Birkenau 복합단지로 보내졌다. 대부분은 즉시 가스로 죽었다.

 

The 94-year-old man was sentenced to four years in prison in July.

머신 번역 : 그 사형 집행인은 7월에 4년 징역형을 선고 받았다.

챠우 번역 : 94-year-old 남자는 7월에 징역 4년형을 선고 받았다.

 

The Associated Press contributed to this report.

머신 번역 : AP통신이 이 보고서에 기고했다.

챠우 번역 : AP가 이 보도에 기고했다.

프로필 이미지 [레벨:20]수원나그네

2016.10.20 (06:29:28)

챠우님이 영어를 엄청 잘하시네요~

List of Articles
No. 제목 글쓴이 날짜 조회
3972 상담에 대해서 구조적으로 풀이해봤습니다. 암흑이 2016-10-26 2065
3971 분노합니다... 다원이 2016-10-24 2261
3970 '아이' 박근혜 5 배태현 2016-10-20 3687
3969 구조론 목요 열린방송 image 4 ahmoo 2016-10-20 2029
3968 토요 독서모임 장소 변경 사전 공지 3 챠우 2016-10-19 2092
3967 근혜어법 분석 image 챠우 2016-10-19 2494
» 네이버 랩 번역기 베타 11 챠우 2016-10-17 4181
3965 한글은, 조선 민중들이 당시 지배자들로 부터 뺏어낸 겁니다. 1 해안 2016-10-16 2508
3964 aosabook 1 눈마 2016-10-16 1941
3963 구조 해설. 2 systema 2016-10-16 2031
3962 영월모임 재공지 image 16 김동렬 2016-10-14 2433
3961 우리는 만났는가 2 배태현 2016-10-14 2048
3960 구조론 목요 열린방송 image ahmoo 2016-10-13 1987
3959 여러개의 CPU가 들어가 있는 컴퓨터 9 눈마 2016-10-12 3453
3958 언어는 언어를 추적하고 배태현 2016-10-12 2066
3957 초딩때 종교를 버린 이유... 깨달음 1 지리산인 2016-10-11 2106
3956 구조론 토요 독서모임 후기 image 9 윤:D 2016-10-10 2270
3955 암살 ,밀정 그리고 그물 1 배태현 2016-10-10 2372
3954 10월15일 영월 동굴탐사 모임 image 6 이산 2016-10-09 2201
3953 무현 , 두 도시 이야기 10 배태현 2016-10-09 2747