오렌지 (소프트웨어)
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
오렌지(Orange)는 GPL 라이선스 하에 배포되고 깃허브에서 호스팅되는 오픈 소스 소프트웨어 패키지이다. C++로 작성된 핵심 구성 요소와 파이썬으로 작성된 래퍼를 통해 다양한 머신 러닝, 전처리, 데이터 시각화 알고리즘을 제공하며, 캔버스 인터페이스를 통해 위젯을 배치하여 데이터 분석 워크플로우를 생성한다. macOS, 윈도우, 리눅스를 지원하며, 텍스트 마이닝, 이미지 분석, 생물 정보학 등 다양한 기능을 애드온 형태로 확장할 수 있다. 1996년 류블랴나 대학교와 요제프 스테판 연구소에서 개발을 시작하여 꾸준히 발전해 왔으며, 생물의학, 생물정보학, 유전체학, 교육 분야 등에서 활용된다.
더 읽어볼만한 페이지
- 데이터 시각화 소프트웨어 - 메이플 (소프트웨어)
메이플은 Maplesoft에서 개발한 컴퓨터 대수 시스템 소프트웨어로, 기호 및 수치 계산, 시각화, 프로그래밍 기능을 제공하며 수학적 모델링, 시뮬레이션, 데이터 분석 등에 활용되어 교육 및 연구 개발 분야에서 널리 사용된다. - 데이터 시각화 소프트웨어 - 키바나
키바나는 엘라스틱서치 클러스터 데이터를 시각화하는 오픈 소스 플랫폼으로, 다양한 시각화 도구를 제공하며 엘라스틱서치, Logstash와 함께 Elastic Stack을 구성한다. - 시계열 소프트웨어 - 시계열 데이터베이스
시계열 데이터베이스는 시간 순서에 따라 기록된 데이터를 효율적으로 저장, 관리, 분석하기 위해 설계된 데이터베이스 시스템으로, 시간 기반 인덱싱, 높은 데이터 압축률, 데이터 보존 정책 등의 특징을 가지며 다양한 분야에서 활용된다. - 시계열 소프트웨어 - Stata
Stata는 통계 분석, 데이터 관리, 그래프 작성 기능을 제공하는 통계 소프트웨어 패키지로, 다양한 운영체제 지원, 명령줄 및 그래픽 사용자 인터페이스 제공, 사회과학 및 자연과학 분야에서의 폭넓은 활용, 사용자 커뮤니티를 통한 확장 기능 지원 및 파이썬 연동을 특징으로 한다. - 수치 해석 소프트웨어 - LINPACK
LINPACK은 부동소수점 연산 성능을 평가하는 벤치마크 프로그램이자 FORTRAN 라이브러리로, 슈퍼컴퓨터 성능 측정 기준으로 사용되는 HPLinpack 벤치마크의 기반이 되었으며, TOP500 목록에서 고성능 컴퓨터 순위를 결정하는 데 기여한다. - 수치 해석 소프트웨어 - NumPy
NumPy는 파이썬에서 다차원 배열을 효과적으로 다루기 위한 라이브러리로, C API를 제공하여 외부 라이브러리와 연동을 지원하며, 다양한 연산 기능과 멀티스레딩을 통한 성능 향상을 제공한다.
2. 소프트웨어
오렌지(Orange)는 GPL 하에 출시되어 GitHub에서 호스팅되는 오픈 소스 소프트웨어 패키지이다. 버전 3.0까지의 핵심 구성 요소는 C++로 작성되었으며, 래퍼는 파이썬으로 작성되었다. 버전 3.0부터 오렌지는 numpy, scipy, scikit-learn과 같은 과학적 컴퓨팅을 위한 공통 파이썬 오픈 소스 라이브러리를 사용하며, 그래픽 사용자 인터페이스는 크로스 플랫폼 Qt 프레임워크 내에서 작동한다.
오렌지는 데이터 시각화, 기계 학습, 데이터 마이닝 및 데이터 분석을 위한 구성 요소 기반의 비주얼 프로그래밍 소프트웨어 패키지이다.
기본 설치에는 6개의 위젯 세트(데이터, 변환, 시각화, 모델, 평가, 비지도 학습)에 여러 머신 러닝, 전처리 및 데이터 시각화 알고리즘이 포함되어 있다. 추가 기능은 애드온 형태로 제공된다(텍스트 마이닝, 이미지 분석, 생물 정보학 등).
오렌지는 macOS, 윈도우 및 Linux에서 지원되며, Python Package Index 저장소에서 ''pip install Orange3'' 명령어를 통해 설치할 수 있다. 2016년 이후, 안정 버전 Ver3.3은 Python 3에서 작동하며, Python 2.7에서 작동하는 이전 버전 Ver2.7도 계속 사용할 수 있다.
3. 기능
오렌지의 구성 요소는 위젯이라고 하며, 데이터 시각화, 부분 집합 선택, 전처리부터 학습 알고리즘 및 예측 모델링의 경험적 평가까지 다양한 기능을 제공한다.
비주얼 프로그래밍은 미리 정의되거나 사용자가 설계한 위젯을 연결하여 워크플로우를 생성하는 인터페이스를 통해 구현된다. 고급 사용자는 오렌지를 데이터 조작 및 위젯 변경을 위한 파이썬 라이브러리로 사용할 수 있다.[4]
Orange는 사용자가 위젯을 배치하고 데이터 분석 워크플로우를 생성하는 캔버스 인터페이스(computing)로 구성되어 있다. 위젯은 데이터를 읽고, 데이터 테이블을 표시하고, 기능을 선택하고, 예측기를 훈련시키고, 학습 알고리즘을 비교하고, 데이터 요소를 시각화하는 등 기본적인 기능을 수행한다. 사용자는 시각화를 대화식으로 탐색하거나 선택한 하위 집합을 다른 위젯에 전달할 수 있다.
4. 확장 기능 (애드온)
오렌지 사용자는 애드온을 통해 핵심 구성 요소 집합을 확장할 수 있다. 지원되는 애드온은 다음과 같다.
- '''연관''': 빈번한 항목 집합 및 연관 규칙 학습을 마이닝하기 위한 구성 요소.
- '''생물정보학''': 유전자 발현 분석, 농축, 발현 데이터베이스(예: 유전자 발현 오미버스) 및 경로 라이브러리에 대한 접근을 위한 구성 요소.
- '''데이터 융합''': 서로 다른 데이터 세트를 융합, 집단 행렬 분해 및 잠재 요인 탐색을 위한 구성 요소.
- '''교육''': k-평균 클러스터링, 다항 회귀, 확률적 경사 하강법 등 기계 학습 개념을 가르치기 위한 구성 요소.
- '''설명''': 샤플리 값 분석을 포함하여 모델 설명을 위한 구성 요소가 있는 확장 기능을 제공한다.
- '''지리''': 지리 공간 데이터 작업에 사용되는 구성 요소.
- '''이미지 분석''': 이미지 및 ImageNet 단어 임베딩 작업에 사용되는 구성 요소
- '''네트워크''': 그래프 및 네트워크 분석을 위한 구성 요소.
- '''텍스트 마이닝''': 자연어 처리 및 텍스트 마이닝을 위한 구성 요소.
- '''시계열''': 시계열 분석 및 모델링을 위한 위젯 구성 요소.
- '''단일 세포''': 단일 세포 데이터 로딩, 필터링 및 배치 효과 제거, 마커 유전자 발견, 세포 및 유전자 점수 매기기, 세포 유형 예측을 포함한 단일 세포 유전자 발현 분석 지원.

- '''분광법''': (하이퍼)분광 데이터 세트의 분석 및 시각화를 위한 구성 요소.[5]
- '''생존 분석''': 생존 데이터를 처리하는 데이터 분석을 위한 애드온이다. Kaplan-Meier 플롯, Cox 회귀 모델 및 여러 파생 위젯과 같은 표준 생존 분석 기술에 대한 위젯이 포함되어 있다.
- '''세계 행복''': OECD 및 세계 개발 지표를 포함하여 데이터베이스에서 사회 경제적 데이터를 다운로드하는 것을 지원한다. 다양한 경제 데이터베이스에서 수천 개의 국가 지표에 대한 접근을 제공한다.
- '''공정성''': 차별 없는 공정한 기계 학습 모델의 평가 및 생성을 위한 애드온이다. 위젯은 통계적 패리티와 같은 공정성 지표 계산에서 공정한 모델을 구축하기 위한 사후, 사전, 내부 처리 방법에 이르기까지 다양하다.[6]
- '''OASYS''' — ORange SYnchrotron Suite[18]
- '''scOrange''' — 단세포 생물통계(single cell biostatistics)
- '''Quasar''' — 자연과학의 데이터 분석(data analysis in natural sciences)
5. 목적
오렌지는 데이터 시각화, 기계 학습, 데이터 마이닝 및 데이터 분석을 위한 구성 요소 기반의 비주얼 프로그래밍 소프트웨어 패키지이다.
오렌지 구성 요소는 위젯이라고 하며, 이들은 단순한 데이터 시각화, 부분 집합 선택, 전처리에서 학습 알고리즘 및 예측 모델링의 경험적 평가에 이르기까지 다양하다.
비주얼 프로그래밍은 미리 정의되거나 사용자가 설계한 위젯을 연결하여 워크플로우를 생성하는 인터페이스를 통해 구현되며, 고급 사용자는 오렌지를 데이터 조작 및 위젯 변경을 위한 파이썬 라이브러리로 사용할 수 있다.[4]
이 프로그램은 실험 선택, 추천 시스템, 예측 모델링을 위한 플랫폼을 제공하며, 생물의학, 생물정보학, 유전체 연구, 교육 분야에서 사용된다. 과학 분야에서는 새로운 기계 학습 알고리즘을 테스트하고, 유전학 및 생물정보학 분야에서 새로운 기술을 구현하기 위한 플랫폼으로 사용된다. 교육 분야에서는 생물학, 생물의학, 정보학 전공 학생들에게 기계 학습 및 데이터 마이닝 방법을 가르치는 데 사용되었다.[4]
6. 역사
1996년, 류블랴나 대학교와 요제프 스테판 연구소는 C++로 머신 러닝 프레임워크인 ML* 개발을 시작했으며, 1997년에는 이 프레임워크를 위한 파이썬 바인딩이 개발되어, 기존의 파이썬 모듈과 함께 Orange라는 공동 프레임워크를 형성했다. 그 후 몇 년 동안 데이터 마이닝과 머신 러닝을 위한 대부분의 주요 알고리즘이 C++(Orange의 핵심) 또는 파이썬 모듈로 구현되었다.
참조
[1]
웹사이트
orange3/CHANGELOG.md at master . biolab/orange3 . GitHub
https://github.com/b[...]
[2]
웹사이트
Orange - License
https://orange.biola[...]
[3]
웹사이트
orange3/LICENSE at master . biolab/orange3 . GitHub
https://github.com/b[...]
[4]
논문
Orange: data mining toolbox in Python
http://eprints.fri.u[...]
[5]
논문
Infrared Orange: Connecting Hyperspectral Data with Machine Learning
[6]
웹사이트
Checking AI for discrimination via GUI using the Orange Fairness Add-On
https://iomids.com/e[...]
IOMIDS
2024-05-30
[7]
서적
Advances in Computational Methods for X-Ray Optics IV
[8]
논문
"Democratized image analytics by visual programming through integration of deep models and small-scale machine learning"
[9]
논문
Quasar: Easy Machine Learning for Biospectroscopy
[10]
웹사이트
Orange3-Geo Documentation — Orange3-Geo documentation
https://orange3-geo.[...]
[11]
논문
scOrange—a tool for hands-on training of concepts from single-cell data analytics
[12]
웹사이트
Orange Canvas Core
https://github.com/b[...]
[13]
웹사이트
Change Log
https://github.com/b[...]
2018-05-10
[14]
논문
Orange: data mining toolbox in Python
http://eprints.fri.u[...]
[15]
웹인용
orange3/CHANGELOG.md at master . biolab/orange3 . GitHub
https://github.com/b[...]
[16]
웹인용
Orange - License
https://orange.biola[...]
[17]
웹인용
orange3/LICENSE at master . biolab/orange3 . GitHub
https://github.com/b[...]
[18]
간행물
L. Rebuffi, M. Sanchez del Rio, Proc. SPIE 10388, 103880S (2017).
https://doi.org/10.1[...]
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com