Fraudit 개요

Forensic data analytics toolkit


Fraudit

많은 데이터 분석가들은 여러 가지 어플리케이션을 사용합니다. MS Excel, VisualBasic, MicrosoftAccess, SAS 등은 각각의 응용 분야의 강점을 가지고 있습니다. 그러나 그 어떤 것도 기업 데이터의 분석이나 심도 있는 데이터 마이닝을 위해 특별히 만들어지지 않았습니다. 어떤 것은 일반적인 데이터베이스고 , 어떤 것은 통계적인 응용 프로그램입니다. 이러한 어플리케이션들을 사용하다 느낀 필요성을 모두 갖춘 Fraudit을 개발하게 된 것입니다.

Fraudit은 Python 베이스의 부정적발, 분식회계탐지 등을 위한 고급 감사 소프트웨어입니다. 또한 다양한 유형의 데이터 분석(Network logs, Scientific data, 데이터베이스 지향 데이터 및 데이터 마이닝 등)에 사용될 수 있는 Framework 입니다.

Fraudit 특징

부정적발, 분식회계탐지 등을 위한 고급 감사 소프트웨어


Python based

데이터 분석에 널리 사용되는 강력하고 쉬운 프로그래밍 언어

Python 문법을 그대로 사용 가능

Python 라이브러리 사용 가능

Scikit-learn, Tensorflow 등과 연동하여 분석 용이

GUI & Script

모든 GUI 기반의 동작은 script code로 확인 가능

Script code로 모든 동작 가능

고급 사용자를 위한 script code 지원으로 분석에 필요한 기능 구현

Script framework

사용자 정의 확장 기능을 create, import, export, manage 하는 기능

고급 사용자가 만든 확장 기능을 일반 사용자도 손쉽게 활용

확장 기능 거래 시장 형성

Python shell Panel

Fraudit의 스크립팅은 강력하고 학습하기 쉬운 컴퓨터 언어인 Python을 기반으로 하고 있습니다.
경쟁 프로그램의 경우 자체 언어를 사용하는데 반하여 Fraudit은 전세계적으로 가장 인기있는 언어인 Python을 토대로 수천개의 라이브러리를 분석 목적에 맞게 인터넷을 통해서 무료로 다운로드 받을 수 있습니다.

  • Python의 정규식 사용 가능
  • 전세계 개발자들, 데이터 분석가들의 코드 활용 가능

강력한 Expression Builder

Fraudit에서는 GUI와 console 모두를 사용 가능합니다.
GUI와 Shell은 양방향이며, 이는 사용자가 GUI에서 변경하는 모든 항목이 Shell 변수에서 변경됨을 의미합니다. 반대로, Shell 변수에서 변경하는 모든 항목 또한 GUI에 즉시 반영됩니다.
사용자가 스크립트 작성 방법(python)을 배울 수 있도록 GUI에서 이용자가 하는 모든 일을 스크립트 코드로 확인 할 수 있습니다.

  • Script에 익숙하지 않은 사용자도 GUI를 통해 손쉽게 expression 적용

Scriptlets

Fraudit의 scriptlet 프레임워크는 스크립팅에 대한 관심이 있고 이를 만들 수 있는 능력이 있는 사람들에게 사용자 정의 확장 기능을 create, import, export, manage 할 수 있도록 제공 합니다.

  • 고급 사용자가 만든 템플릿 형태의 특수 기능들을 plug-in 하여 사용
  • 사용자는 scriptlet을 통하여 자신이 만든 템플릿을 판매하거나, 다른 사용자의 템플릿을 구매 하여 사용

Anomalies Detection using Deep Learning

Fraudit은 Python위에 구축된 모듈, 기능 및 루틴 세트 입니다. 버전 업그레이드 없이 Python 연동과 Scriptlet 프레임워크를 이용하여 수천 개의 라이브러리를 분석 목적에 맞게 인터넷을 통해서 다운로드 받을 수 있으며 구글의 tensorflow 라이브러리를 임포트하여 머신러닝, 딥러닝 기반의 예측 분석 기능 추가가 가능 합니다.

  • Autoencoder network 을 이용한 이상치 추출
  • 감사 대상 후보군을 대폭 줄여 효율성 증대

경쟁 제품 비교

경쟁 제품군에 비해 우수한 기능


Fraudit

외산 제품의 경우 높은 가격을 요하기 때문에 일부에서는 MS Excel을 많이 사용고 있는 상황입니다. Excel은 레코드수의 제한(약 100만개)이 있어 대량 데이터(빅데이터)의 분석에 맞지 않고 실제로 20∼30만개만 넘어도 컴퓨터 메모리를 많이 사용하기 때문에 처리속도에서 많은 문제점을 가지고 있습니다.

Fraudit은 저렴한 가격으로 외산 제품보다 유연한 계층화 기능과 호환성이 뛰어난 Script 기능을 제공합니다.

Fraudit은 외산 제품에 못지않은 기능을 제공하고 있으며 파이썬을 베이스로 머신러닝, 딥러닝으로 응용 가능성이 무궁무진하다는점과 가격도 외산 제품에 비하면 상대적으로 저렴하며 국산 소프트웨어이므로 신속한 업그레이드와 적시성 있는 교육 제공이 가능하다는 점에서 기대가 된다.

정용준 한국XBRL본부 실장

"컴퓨터를 이용한 감사기법(CAATs: Computer Assisted Audit Techniques)", 월간공인회계사 5월호, P66