오렌지 (소프트웨어)
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
오렌지(Orange)는 GPL 라이선스 하에 배포되고 깃허브에서 호스팅되는 오픈 소스 소프트웨어 패키지이다. C++로 작성된 핵심 구성 요소와 파이썬으로 작성된 래퍼를 통해 다양한 머신 러닝, 전처리, 데이터 시각화 알고리즘을 제공하며, 캔버스 인터페이스를 통해 위젯을 배치하여 데이터 분석 워크플로우를 생성한다. macOS, 윈도우, 리눅스를 지원하며, 텍스트 마이닝, 이미지 분석, 생물 정보학 등 다양한 기능을 애드온 형태로 확장할 수 있다. 1996년 류블랴나 대학교와 요제프 스테판 연구소에서 개발을 시작하여 꾸준히 발전해 왔으며, 생물의학, 생물정보학, 유전체학, 교육 분야 등에서 활용된다.
더 읽어볼만한 페이지
- 데이터 시각화 소프트웨어 - 메이플 (소프트웨어)
메이플은 Maplesoft에서 개발한 컴퓨터 대수 시스템 소프트웨어로, 기호 및 수치 계산, 시각화, 프로그래밍 기능을 제공하며 수학적 모델링, 시뮬레이션, 데이터 분석 등에 활용되어 교육 및 연구 개발 분야에서 널리 사용된다. - 데이터 시각화 소프트웨어 - 키바나
키바나는 엘라스틱서치 클러스터 데이터를 시각화하는 오픈 소스 플랫폼으로, 다양한 시각화 도구를 제공하며 엘라스틱서치, Logstash와 함께 Elastic Stack을 구성한다. - 시계열 소프트웨어 - 시계열 데이터베이스
시계열 데이터베이스는 시간 순서에 따라 기록된 데이터를 효율적으로 저장, 관리, 분석하기 위해 설계된 데이터베이스 시스템으로, 시간 기반 인덱싱, 높은 데이터 압축률, 데이터 보존 정책 등의 특징을 가지며 다양한 분야에서 활용된다. - 시계열 소프트웨어 - Stata
Stata는 통계 분석, 데이터 관리, 그래프 작성 기능을 제공하는 통계 소프트웨어 패키지로, 다양한 운영체제 지원, 명령줄 및 그래픽 사용자 인터페이스 제공, 사회과학 및 자연과학 분야에서의 폭넓은 활용, 사용자 커뮤니티를 통한 확장 기능 지원 및 파이썬 연동을 특징으로 한다. - 수치 해석 소프트웨어 - LINPACK
LINPACK은 부동소수점 연산 성능을 평가하는 벤치마크 프로그램이자 FORTRAN 라이브러리로, 슈퍼컴퓨터 성능 측정 기준으로 사용되는 HPLinpack 벤치마크의 기반이 되었으며, TOP500 목록에서 고성능 컴퓨터 순위를 결정하는 데 기여한다. - 수치 해석 소프트웨어 - NumPy
NumPy는 파이썬에서 다차원 배열을 효과적으로 다루기 위한 라이브러리로, C API를 제공하여 외부 라이브러리와 연동을 지원하며, 다양한 연산 기능과 멀티스레딩을 통한 성능 향상을 제공한다.
오렌지 (소프트웨어) - [IT 관련 정보]에 관한 문서 | |
---|---|
기본 정보 | |
이름 | Orange |
종류 | 기계 학습, 데이터 마이닝, 데이터 시각화, 데이터 분석 소프트웨어 |
개발자 | 류블랴나 대학교 |
최초 출시일 | 1996년 10월 10일 |
최신 안정화 버전 | 3.13.0 |
최신 안정화 버전 출시일 | 2018년 4월 17일 |
저장소 | Orange 저장소 |
프로그래밍 언어 | 파이썬, Cython, C++, C |
운영 체제 | 크로스 플랫폼 |
라이선스 | GPLv3 이상 |
웹사이트 | 공식 웹사이트 |
2. 소프트웨어
오렌지(Orange)는 GPL 하에 출시되어 GitHub에서 호스팅되는 오픈 소스 소프트웨어 패키지이다. 버전 3.0까지의 핵심 구성 요소는 C++로 작성되었으며, 래퍼는 파이썬으로 작성되었다. 버전 3.0부터 오렌지는 numpy, scipy, scikit-learn과 같은 과학적 컴퓨팅을 위한 공통 파이썬 오픈 소스 라이브러리를 사용하며, 그래픽 사용자 인터페이스는 크로스 플랫폼 Qt 프레임워크 내에서 작동한다.
오렌지는 데이터 시각화, 기계 학습, 데이터 마이닝 및 데이터 분석을 위한 구성 요소 기반의 비주얼 프로그래밍 소프트웨어 패키지이다.
기본 설치에는 6개의 위젯 세트(데이터, 변환, 시각화, 모델, 평가, 비지도 학습)에 여러 머신 러닝, 전처리 및 데이터 시각화 알고리즘이 포함되어 있다. 추가 기능은 애드온 형태로 제공된다(텍스트 마이닝, 이미지 분석, 생물 정보학 등).
오렌지는 macOS, 윈도우 및 Linux에서 지원되며, Python Package Index 저장소에서 ''pip install Orange3'' 명령어를 통해 설치할 수 있다. 2016년 이후, 안정 버전 Ver3.3은 Python 3에서 작동하며, Python 2.7에서 작동하는 이전 버전 Ver2.7도 계속 사용할 수 있다.
3. 기능
오렌지의 구성 요소는 위젯이라고 하며, 데이터 시각화, 부분 집합 선택, 전처리부터 학습 알고리즘 및 예측 모델링의 경험적 평가까지 다양한 기능을 제공한다.
비주얼 프로그래밍은 미리 정의되거나 사용자가 설계한 위젯을 연결하여 워크플로우를 생성하는 인터페이스를 통해 구현된다. 고급 사용자는 오렌지를 데이터 조작 및 위젯 변경을 위한 파이썬 라이브러리로 사용할 수 있다.[4]
Orange는 사용자가 위젯을 배치하고 데이터 분석 워크플로우를 생성하는 캔버스 인터페이스(computing)로 구성되어 있다. 위젯은 데이터를 읽고, 데이터 테이블을 표시하고, 기능을 선택하고, 예측기를 훈련시키고, 학습 알고리즘을 비교하고, 데이터 요소를 시각화하는 등 기본적인 기능을 수행한다. 사용자는 시각화를 대화식으로 탐색하거나 선택한 하위 집합을 다른 위젯에 전달할 수 있다.
종류 | 설명 |
---|---|
데이터 | 데이터 입력, 데이터 필터링, 샘플링, 대입, 기능 조작 및 특징 선택을 위한 위젯 |
시각화 | 일반적인 시각화(상자 그림, 히스토그램, 산점도) 및 다변량 시각화(모자이크 디스플레이, 체 그림)를 위한 위젯 |
분류 | 분류를 위한 일련의 지도 학습 알고리즘 |
회귀 | 회귀를 위한 일련의 지도 학습 머신 러닝 알고리즘 |
평가 | 교차 검증, 샘플링 기반 절차, 예측 방법의 신뢰도 추정 및 채점 |
비지도 | 클러스터 분석 (k-평균, 계층적 클러스터링) 및 데이터 투영 기술(다차원 척도법, 주성분 분석, 대응 분석)을 위한 비지도 학습 알고리즘 |
4. 확장 기능 (애드온)
오렌지 사용자는 애드온을 통해 핵심 구성 요소 집합을 확장할 수 있다. 지원되는 애드온은 다음과 같다.
- '''연관''': 빈번한 항목 집합 및 연관 규칙 학습을 마이닝하기 위한 구성 요소.
- '''생물정보학''': 유전자 발현 분석, 농축, 발현 데이터베이스(예: 유전자 발현 오미버스) 및 경로 라이브러리에 대한 접근을 위한 구성 요소.
- '''데이터 융합''': 서로 다른 데이터 세트를 융합, 집단 행렬 분해 및 잠재 요인 탐색을 위한 구성 요소.
- '''교육''': k-평균 클러스터링, 다항 회귀, 확률적 경사 하강법 등 기계 학습 개념을 가르치기 위한 구성 요소.
- '''설명''': 샤플리 값 분석을 포함하여 모델 설명을 위한 구성 요소가 있는 확장 기능을 제공한다.
- '''지리''': 지리 공간 데이터 작업에 사용되는 구성 요소.
- '''이미지 분석''': 이미지 및 ImageNet 단어 임베딩 작업에 사용되는 구성 요소
- '''네트워크''': 그래프 및 네트워크 분석을 위한 구성 요소.
- '''텍스트 마이닝''': 자연어 처리 및 텍스트 마이닝을 위한 구성 요소.
- '''시계열''': 시계열 분석 및 모델링을 위한 위젯 구성 요소.
- '''단일 세포''': 단일 세포 데이터 로딩, 필터링 및 배치 효과 제거, 마커 유전자 발견, 세포 및 유전자 점수 매기기, 세포 유형 예측을 포함한 단일 세포 유전자 발현 분석 지원.

- '''분광법''': (하이퍼)분광 데이터 세트의 분석 및 시각화를 위한 구성 요소.[5]
- '''생존 분석''': 생존 데이터를 처리하는 데이터 분석을 위한 애드온이다. Kaplan-Meier 플롯, Cox 회귀 모델 및 여러 파생 위젯과 같은 표준 생존 분석 기술에 대한 위젯이 포함되어 있다.
- '''세계 행복''': OECD 및 세계 개발 지표를 포함하여 데이터베이스에서 사회 경제적 데이터를 다운로드하는 것을 지원한다. 다양한 경제 데이터베이스에서 수천 개의 국가 지표에 대한 접근을 제공한다.
- '''공정성''': 차별 없는 공정한 기계 학습 모델의 평가 및 생성을 위한 애드온이다. 위젯은 통계적 패리티와 같은 공정성 지표 계산에서 공정한 모델을 구축하기 위한 사후, 사전, 내부 처리 방법에 이르기까지 다양하다.[6]
- '''OASYS''' — ORange SYnchrotron Suite[18]
- '''scOrange''' — 단세포 생물통계(single cell biostatistics)
- '''Quasar''' — 자연과학의 데이터 분석(data analysis in natural sciences)
5. 목적
오렌지는 데이터 시각화, 기계 학습, 데이터 마이닝 및 데이터 분석을 위한 구성 요소 기반의 비주얼 프로그래밍 소프트웨어 패키지이다.
오렌지 구성 요소는 위젯이라고 하며, 이들은 단순한 데이터 시각화, 부분 집합 선택, 전처리에서 학습 알고리즘 및 예측 모델링의 경험적 평가에 이르기까지 다양하다.
비주얼 프로그래밍은 미리 정의되거나 사용자가 설계한 위젯을 연결하여 워크플로우를 생성하는 인터페이스를 통해 구현되며, 고급 사용자는 오렌지를 데이터 조작 및 위젯 변경을 위한 파이썬 라이브러리로 사용할 수 있다.[4]
이 프로그램은 실험 선택, 추천 시스템, 예측 모델링을 위한 플랫폼을 제공하며, 생물의학, 생물정보학, 유전체 연구, 교육 분야에서 사용된다. 과학 분야에서는 새로운 기계 학습 알고리즘을 테스트하고, 유전학 및 생물정보학 분야에서 새로운 기술을 구현하기 위한 플랫폼으로 사용된다. 교육 분야에서는 생물학, 생물의학, 정보학 전공 학생들에게 기계 학습 및 데이터 마이닝 방법을 가르치는 데 사용되었다.[4]
6. 역사
1996년, 류블랴나 대학교와 요제프 스테판 연구소는 C++로 머신 러닝 프레임워크인 ML* 개발을 시작했으며, 1997년에는 이 프레임워크를 위한 파이썬 바인딩이 개발되어, 기존의 파이썬 모듈과 함께 Orange라는 공동 프레임워크를 형성했다. 그 후 몇 년 동안 데이터 마이닝과 머신 러닝을 위한 대부분의 주요 알고리즘이 C++(Orange의 핵심) 또는 파이썬 모듈로 구현되었다.
연도 | 내용 |
---|---|
2002년 | Pmw 파이썬 메가위젯을 사용하여 유연한 그래픽 사용자 인터페이스를 만들기 위한 첫 번째 프로토타입이 설계되었다. |
2003년 | 그래픽 사용자 인터페이스는 Qt 프레임워크를 위해 PyQt 파이썬 바인딩을 사용하여 재설계 및 재개발되었다. 시각적 프로그래밍 프레임워크가 정의되었고, 위젯(데이터 분석 파이프라인의 그래픽 구성 요소) 개발이 시작되었다. |
2005년 | 생물 정보학에서 데이터 분석을 위한 확장 기능이 제작되었다. |
2008년 | Mac OS X DMG 및 Fink 기반 설치 패키지가 개발되었다. |
2009년 | 100개 이상의 위젯이 생성되고 유지 관리되었다. Orange 2.0 베타가 출시되었으며, 매일 컴파일 주기를 기반으로 웹사이트에서 설치 패키지를 제공했다. |
2012년 | 이전의 모듈 기반 구조를 대체하는 새로운 객체 계층이 도입되었다. |
2013년 | 그래픽 사용자 인터페이스의 상당한 재설계에는 새로운 도구 상자와 워크플로우 묘사가 포함되었다. |
2015년 | Orange 3.0이 출시되었다. Orange는 데이터를 NumPy 배열에 저장하고, 머신 러닝 알고리즘은 주로 scikit-learn을 사용한다. Orange3용 텍스트 분석 추가 기능이 출시되었다. |
2016년 | Orange는 버전 3.3을 출시했다. 개발은 안정적인 릴리스를 위한 월간 주기를 계획했다. 이미지 임베딩을 위한 서버 측 딥 신경망을 갖춘 이미지 분석 추가 기능의 개발 및 릴리스를 시작했다. |
2017년 | 스펙트럼 데이터 분석을 위한 분광학 추가 기능, 지리 위치 데이터 처리 및 지리 맵 시각화를 위한 Geo 추가 기능이 도입되었다. |
2018년 | Orange는 단일 세포 데이터 분석을 위한 추가 기능의 개발 및 릴리스를 시작했다. |
2019년 | Orange는 개발을 위한 그래픽 인터페이스를 별도의 프로젝트인 orange-canvas-core로 분리했다. |
2020년 | Orange는 특정 특징이 특정 클래스를 예측하는 데 기여하는 강점과 기여도를 강조하는 분류 모델 및 회귀 모델을 설명하는 위젯을 갖춘 Explain 추가 기능을 도입했다. |
2022년 | Orange3 데이터 마이닝 스위트를 위한 추가 기능인 World Happiness가 도입되어 세계 행복 보고서, 세계 개발 지표, OECD와 같은 다양한 데이터베이스에서 사회 경제적 데이터에 액세스하기 위한 위젯을 제공했다. Orange는 Explain 추가 기능을 개별 조건부 기대치 플롯과 순열 특징 중요도 기술로 확장했다. |
2023년 | Orange는 바이어스 지표를 계산하는 위젯과 사전, 사후 및 처리 중 방법을 위한 위젯을 포함하는 Fairness 추가 기능을 도입하여 데이터 세트의 변덕스러움으로 인한 체계적인 오류에 덜 민감한 모델을 만들 수 있도록 했다. |
참조
[1]
웹사이트
orange3/CHANGELOG.md at master . biolab/orange3 . GitHub
https://github.com/b[...]
[2]
웹사이트
Orange - License
https://orange.biola[...]
[3]
웹사이트
orange3/LICENSE at master . biolab/orange3 . GitHub
https://github.com/b[...]
[4]
논문
Orange: data mining toolbox in Python
http://eprints.fri.u[...]
[5]
논문
Infrared Orange: Connecting Hyperspectral Data with Machine Learning
[6]
웹사이트
Checking AI for discrimination via GUI using the Orange Fairness Add-On
https://iomids.com/e[...]
IOMIDS
2024-05-30
[7]
서적
Advances in Computational Methods for X-Ray Optics IV
[8]
논문
"Democratized image analytics by visual programming through integration of deep models and small-scale machine learning"
[9]
논문
Quasar: Easy Machine Learning for Biospectroscopy
[10]
웹사이트
Orange3-Geo Documentation — Orange3-Geo documentation
https://orange3-geo.[...]
[11]
논문
scOrange—a tool for hands-on training of concepts from single-cell data analytics
[12]
웹사이트
Orange Canvas Core
https://github.com/b[...]
[13]
웹사이트
Change Log
https://github.com/b[...]
2018-05-10
[14]
논문
Orange: data mining toolbox in Python
http://eprints.fri.u[...]
[15]
웹인용
orange3/CHANGELOG.md at master . biolab/orange3 . GitHub
https://github.com/b[...]
[16]
웹인용
Orange - License
https://orange.biola[...]
[17]
웹인용
orange3/LICENSE at master . biolab/orange3 . GitHub
https://github.com/b[...]
[18]
간행물
L. Rebuffi, M. Sanchez del Rio, Proc. SPIE 10388, 103880S (2017).
https://doi.org/10.1[...]
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com