데이터파싱2 [계산 화학 자동화] 파이썬으로 ORCA/Gaussian 시뮬레이션 입력 파일 100개 자동 생성 및 결과 데이터(Energy, HOMO/LUMO) 파싱하기 [계산 화학 자동화] 파이썬으로 ORCA/Gaussian 시뮬레이션 입력 파일 100개 자동 생성 및 결과 데이터(Energy, HOMO/LUMO) 파싱하기지난 포스팅에서는 파이썬(Python) 머신러닝(scikit-learn)을 활용하여 신소재의 물성을 예측하는 AI 모델을 구축해 보았습니다. 인공지능이 똑똑해지려면 결국 양질의 데이터가 대량으로 필요합니다. 금속유기골격체(MOF)의 리간드(Ligand) 구조를 스크리닝하거나 2차원 GFET 채널 물질의 특성을 연구할 때, 우리는 밀도범함수이론(DFT) 계산을 수행합니다. 하지만 100개의 후보 물질에 대해 ORCA나 Gaussian과 같은 양자 화학 소프트웨어를 돌리기 위해, 메모장을 열어 좌표(XYZ)를 복사하고 계산 키워드를 일일이 타이핑하여 10.. 2026. 5. 19. [파이썬 실전] 양자 화학 시뮬레이션(ORCA/VASP) 로그 파일에서 핵심 데이터 자동 추출하기 (정규표현식 활용) 이전 시리즈들에서 우리는 계산 화학 및 다중 물리 시뮬레이션의 효율을 극대화하기 위한 파이썬(Python) 기반의 워크플로우 자동화 개념을 살펴보았습니다. 이번 포스팅부터는 실제 연구 현장에서 즉시 복사하여 사용할 수 있는 실전 파이썬 스크립트를 하나씩 리뷰해 보겠습니다. 첫 번째 주제는 밀도범함수이론(DFT) 시뮬레이션 직후 가장 먼저 마주하게 되는 '데이터 파싱(Data Parsing)' 작업입니다. ORCA나 VASP와 같은 양자 화학 프로그램이 뱉어내는 방대한 텍스트 로그 파일에서 우리가 원하는 정확한 수치만 1초 만에 추출하여 엑셀(CSV) 파일로 정리하는 강력한 자동화 코드를 소개합니다.1. 수작업 데이터 수집의 한계와 방대한 출력(Output) 파일의 구조촉매의 반응성이나 금속유기골격체(MO.. 2026. 4. 21. 이전 1 다음