학회 출장 보고

학회 : First International Conference on Pattern Recognition and Machine Intelligence (PReMI'05)

기간 : 2005년 12월 18일 - 22일

장소 : Indian Statistical Institute, Kolkata, India

실제 출장 기간 : 2005년 12월 17일 - 24일

숙박 : Guest House of Indian Statistical Institute

경로 : 서울->싱가폴->콜카타->싱가폴->서울

1. 도착

싱가폴을 떠난 비행기는 대략 3시간 30분 정도의 비행을 마치고 인도 캘커타 활주로에 내려 앉았다. 서울에서와 마찬가지로 인도인들도 재빨리 핸드폰을 열고 통화를 시작했다. 일렬로 늘어선 행렬을 따라 마침내 비행기 밖으로 나왔다. 왠지 낯설어 보이는 에스컬레이터를 타고 내려오니 길게 늘어선 입국심사 줄이 보였고 한참을 기다려야 했다. 마침내 빠져 나온 입국장 풍경은 예상한대로 사람들로 장사진을 이루고 있었다. 시내로 들어가는 교통편이 불편하여 손님들을 픽업하기 위해 나온 사람들 때문이라고 생각이 들었다. 택시는 prepaid taxi라고 불리는 걸 이용했는데 택시 조합에서 나온 사람에게 돈을 먼저 지불하고 표를 얻은 후에 밖으로 나가 택시를 타는 방식이다. 예상대로 밖으로 나오니 많은 사람들이 달라 붙었다. 다짜고짜 뭐라고들 하면서 달려드는데 그냥 무시하고 택시 있는 곳까지 전진했다. 인도가 처음이 아닌데도 늘 뭔가 당황스럽고 불편하다. 알고 보니 우리에게 달려들었던 사람들은 택시조합 사람들이었다. 어쩌면 내가 너무 겁먹었는지도 모르겠다. 택시는 매우 구형이다. 우리나라라면 폐차했을 정도의 차들이지만 이곳에선 매우 유용해 보였다. 이들의 생계수단일 테니까. 택시 뒷자리에 앉아서 운전사가 오길 기다렸다. 택시가 출발한 건 다소 시간이 지나서였다. 캘커타의 도로에는 중앙선이 없는 경우가 많다. 교통 신호가 드문 드문 있지만 제 역할을 못한다. 끊임없이 울려대는 경적 소리가 이곳이 인도임을 알려준다. 약 30분 정도 걸려 인도 통계 연구소 게스트 하우스에 도착했다.

게스트 하우스에 여정을 풀고 뭔가를 응시하는 나.

2. 튜토리얼

튜토리얼의 등록비는 150$였다. 학회 등록은 했지만 튜토리얼 등록은 따로 안 했기 때문에 내심 걱정을 했지만 듣는 데는 별 문제 없었다. 다만 발표자료집이 제공되진 않았다. 거기다 점심과 저녁을 제공해 주었기 때문에 매우 편했다. 첫째 날의 주제는 영상으로부터 정보를 분석하는 기술에 관한 것이었다. 메릴랜드 대학의 쉘라파 교수님은 얼굴인식을 주제로 발표를 하셨고 펜실베니아 대학의 우둡타 교수님은 의료영상 분석에 대해 강의를 하셨다.

(1) 쉘라파 교수님 강의

- 정지영상에서의 얼굴인식, 동영상에서의 얼굴인식, 얼굴인식 문제에 있어서의 도전적인 문제들이라는 세 가지 주제를 가지고 발표를 하셨다. 동영상에서의 얼굴 인식은 정지영상에서의 얼굴인식이 시간이라는 축을 기준으로 확장된 것으로 볼 수 있다. 나이가 들어감에 따라 얼굴이 바뀌는 문제 (age), 조명과 얼굴의 각도에 따라 달라지는 영상의 문제, 얼굴인식과 다른 생체 인식 기법의 결합을 통한 성능 향상 (멀티 모달 생체 인식) 등을 이 분야에서 해결해야 할 문제들로 꼽았다.

(2) 우둡타 교수님 강의

- 나중에 저녁식사 시간에 이야기를 해볼 기회가 있어서 친분을 쌓을 수 있었던 교수님이다. 최근 의료장비의 눈부신 발달로 인체에 특정한 도구를 삽입하지 않고 내부의 모습을 알아낼 수 있는 기술이 가능해졌다. 의사가 의료영상을 통해 환자의 상태를 진단하게 되는데 raw image만을 이용하는 것은 효과적이지 못하다. 컴퓨터 지원도구를 이용한 재처리를 통하여 보다 시각적이고 조작이 가능한 형태의 영상으로 변환한다. 바뀌어진 영상은 운동 시뮬레이션을 통하여 가상 수술도 해볼 수 있다. 이러한 과정을 위한 핵심 기술은 컴퓨터 그래픽스 기술과 정반대 개념으로 이해하면 된다. 즉 컴퓨터 그래픽스 기술이 자료구조 형태의 객체들을 실사에 가까운 이미지로 변환하는 과정이라면 의료 영상분석은 거꾸로 획득한 2차원 혹은 3차원 이미지로부터 2차원 혹은 3차원 객체들의 자료구조를 재구성하는 방식이다. Segmentation 기술을 이용하여 이미지 상에 있는 각 장기들을 구분해 내고 각각을 객체화 시킨 후 위치 변경, 재 시각화 등을 수행하게 된다.

학회를 알리는 게스트 하우스 앞의 안내판

둘째 날에는 학회의 시작을 축하하는 행사가 있었다. 콜카타가 속한 웨스트 뱅갈 주의 지사가 오기로 되어 있어서 초대장을 반드시 지참해야 했고 군인들이 여기 저기 서 있었으며 검문도 받아야 했다. 익히 들어오던 S. K. Pal, S. Mitra, S. Bandyopadhyay 등을 볼 수 있었다. S. K. Pal은 이웃집 아저씨 같은 인상을 하고 있었고 S. Mitra는 중년의 아주머니로 보였다. Sanghamitra는 상대적으로 젊어서 에너지가 넘쳐 보였다. 서 뱅갈 주의 지사가 빨리 인도에도 컴퓨터를 보급해서 정보로부터 소외된 사람들에게 도움을 주자는 요지의 발표를 했다. 주 지사가 떠나자 학회장은 다시 평온을 찾았다.

둘째 날의 튜토리얼은 두 개가 예정되어 있었는데 하나는 지문인식으로 유명한 Jain의 강의였고 다른 하나는 Case-based reasoning에 대한 강의였다. 원래 CBR을 강의하기로 했던 David Aha라는 분이 비행기 문제로 오시지 못하게 되어 홍콩의 Shiu 교수님이 대신하셨다.

(1) Jain 강의

Jain의 강의는 전반부의 개괄적인 내용은 Jain이 직접 강의하고 후반부의 자세한 기술내용은 그의 제자인 웨스트 버지니아 대학의 A. Ross 교수가 담당했다. 생체인식에 관한 일반적인 내용과 최근에 Ross 교수님이 연구하고 있는 내용에 대한 설명이 주를 이루었다. 이야기의 시작은 각종 패스워드를 외우고 다녀야 하는 불편함에 대한 것으로부터 시작했다. 대부분의 사람들이 여러 개의 패스워드를 외우고 다니는데 대부분이 쉽게 추론이 가능한 것들인 경우가 많아 보안에 취약하다. 이러한 문제를 해결하기 위해 인간의 몸의 생체 정보를 활용하여 패스워드를 대체하려는 것이 생체인식이다. 활용 가능한 생체 정보는 매우 다양한데, 지문, 얼굴, 손바닥, 걸음 걸이, 정맥의 모양, 홍채 등이 대표적이다. 각각의 방법은 여러 가지 기준으로 비교해 보았을 때 각각 장단점을 가지고 있다. 또한 생체정보이기 때문에 외부 환경의 영향으로 훼손이 가능하며, 인식이 완벽하게 맞다/틀리다 (패스워드는 그렇게 된다)로 이루어지지 않기 때문에 임계치 설정의 문제가 발생하고, 조작된 생체 정보에 취약할 수 있으며, 개인의 나이와 연령에 영향을 받는 등의 문제가 있다. 얼굴인식의 경우 모자, 화장, 액세서리, 표정, 조명 등에 따라 동일한 인물도 서로 다르게 판단될 수 있으나 지문의 경우는 그렇지 않다. 지문인식에 관한 발표는 깊이 있게 이해하진 못하였으나 3차원 스캐너를 사용한 3차원 지문 영상의 획득, 템플릿 기반 인식, 특징 추출, 지문정보 전송을 위한 보안 등에 관한 문제를 다루었다.

(2) Shiu 교수님 강의

David Aha 교수님의 스케줄에 차질이 생겨서 갑작스럽게 강의를 준비하게 된 Shiu 교수님은 가방 까지 잃어버리셔서 정말로 급하게 발표를 준비해오셨다. 이 부분의 강의 전반부는 Soft Case-based Reasoning이라는 자신과 S. K. Pal이 함께 쓴 책에 대한 설명이었다. Soft CBR은 retrieve, reuse, revise, retain의 과정 중에 soft computing 기법 (fuzzy, neural, rough)을 사용하는 프레임워크를 의미한다. 발표가 끝나고 인도 연구원들과 학생들의 질문이 끊임없이 이어져서 새로운 자극을 받을 수 있었다. 비록 인도가 경제적으로나 환경적으로 우리보다 못하겠지만 공부를 하겠다는 기본적인 열의는 우리보다 낳을 수 있다는 생각이 들었다. 이러한 이유로 인도의 많은 학자들이 미국에서도 인정받고 세계적으로 중요한 역할을 하고 있는 것이 아닌가 생각이 들었다.

3. 학회

이번 학회는 상대적으로 많은 plenary talk과 invited talk를 준비했다. 기억에 남는 발표로 다음과 같은 것이 있다.

(1) Jain의 클러스터링 관련 발표

http://dataclustering.cse.msu.edu/ 에 가면 클러스터링에 관한 잘 정리된 자료를 접할 수 있다. Jain 강의는 클러스터링의 최근 연구 내용을 다루고 있다. 클러스터링 앙상블이란 것은 하나의 클러스터링 기법만으로 원하는 결과를 얻을 수 없다는 사실에서 출발한다. 즉 우리가 하나의 분류기만으로 원하는 결과를 얻을 수 없기 때문에 분류기 앙상블을 하듯이 클러스터링도 앙상블을 해서 더 좋은 결과를 얻을 수 있다는 것이 클러스터링 앙상블의 개념이다. 하나의 클러스터링 방법을 초기화만 다르게 한 후 수십에서 수백 번 반복하고 그 결과를 결합하여 최종 클러스터를 결정하는 방식이다. 여기에서의 중심 이슈는 분류기 앙상블과 유사하다. 어떻게 결과를 결합할 것인가? 동일한 클러스터링 방법을 결합할 것인가? 서로 다른 클러스터링 방법을 결합할 것인가 등에 대한 연구가 진행되고 있다. Constraint를 고려한 클러스터링에서는 도메인 전문가가 사전에 해당 도메인에 이미 알려져 있거나 지켜져야 할 constraint를 부과함으로써 클러스터링의 성능을 높일 수 있다는 것이다. 여기에서 어떻게 constraint를 얻어낼 것인가와 같은 문제에 대한 것이 초점이 아니라고 강조하시면서 연구의 대상은 constraint가 있다고 가정할 때 이걸 이용해서 어떻게 좋은 결과를 얻을 수 있는 가에 대한 방법 제시라고 말하셨다.

(2) Aggarwal 교수님의 evening talk

인간의 행동을 영상으로부터 인식하기 위한 방법에 대해 소개했다. 예전에 윤석이가 발표한 BN을 이용하여 기본적인 행동 primitive를 인식하고 상위 레벨에서 dynamic BN을 이용하여 최종적으로 어떤 행동인가를 인식하는 모델을 설명하셨다. 기본적으로 인간의 행동을 인식하는 것이 매우 어렵기 때문에 매우 쉬운 행동 (포옹, 주먹질) 들을 대상으로 기술 개발을 하고 계신다고 하셨다. 여러 가지 문제가 행동 인식을 수행하는데 존재하는데, 예를 들어, 사용자가 어떤 행동을 실제로 하는 건 아니고 하는 척 하는 경우 (물에 빠진 척 하는 것)의 구분, 주먹으로 상대를 때리는 것과 상대에게 친근감의 표시로 팔을 올리는 경우의 구분이 모호함 등이 있다.

(3) M. Zaki 교수님의 강의

30분 정도의 짧은 강의였는데 핵심은  현재까지의 다양한 데이터 마이닝 기법들이 다양한 종류의 데이터 타입을 대상으로 서로 다른 형태로 개발되어 왔는데 이를 그래프 형태의 하나의 통일된 자료 구조를 정의하고 이에 대한 데이터 마이닝 알고리즘만 개발하여 공유하도록 하여 서로 다른 자료 구조와 알고리즘을 다루는데 발생하는 비용을 줄이자는 것이다. 이미 기본적인 자료구조와 알고리즘 라이브러리는 공개했다고 한다.

기술 세션에서는 rough set관련된 논문 발표를 많이 들을 수 있었다. Rough Set에서 reduction이라는 개념이 있는데 변수의 순서에 따라 reduction 성능이 달라진다고 한다. 이러한 문제를 해결하기 위해 genetic algorithm을 이용해서 reduction의 최적 순서를 결정하는 연구를 발표하였고 island 모델이라는 일종의 섬모델을 이용하여 시간과 성능 향상을 얻을 수 있었다고 한다. 이러한 모델이 종분화와 유사하여 Dominik Slezak 교수님에게 잠시 우리쪽 연구를 이야기하였다. Rough Set이 흥미롭기는 했지만 전반적으로 이론에 치우친 면이 강했다. 바이오쪽 연구로 gene ordering연구가 있었는데 gene ordering 문제를 TSP로 변환하여 풀고 이를 위한 GA기반 탐색 방법에 대한 연구였다. 세션 체어인 Michael Zhang교수님이 gene ordering의 생물학적인 의미가 무엇인가에 대해 물으시면서 매우 많은 질의 응답이 오고 갔다. 중간에 시간이 나서 Sanghamitra 교수님과 연구내용에 대해 토의할 시간이 있었다. Bayesian network refinement 문제를 multi-objective GA를 이용하여 푸는 것에 대해 잠시 토의했다. 포스터 세션 발표장이 다소 열악했지만 그래도 성공적으로 발표를 마칠 수 있었다.