stackoverflow.com/questions/222030/how-do-i-create-7-zip-archives-with-net

 

How do I create 7-Zip archives with .NET?

How can I create 7-Zip archives from my C# console application? I need to be able to extract the archives using the regular, widely available 7-Zip program. Here are my results with the examples

stackoverflow.com

7z(7-zip)을 c#에서 사용하는 방법을 구글에서 검색하면, 일단 제일 먼저 위의 글을 발견하게 된다.

뭔가 방법이 많은데.. 그만큼 고민이 많다는 뜻이 되겠다.

 

먼저 개념부터 잡고 가자. 7z은 파일을 압축할 때는 LZMA라고 하는 암호화 라이브러리로 압축을 한다. 좀 더 정확하게 말하자면, 파일 하나의 내용물만 압축할 때는 이 LZMA를 사용한다. 하지만, 여러 개의 압축된 파일을 하나로 묶고 싶다면? 이때 필요한 것이 7z이라는 파일 포맷이다. 7z 파일 포맷에는 파일명과 파일 사이즈, 날짜 등 각종 추가 정보도 포함되어 있다. 즉, 알맹이는 LZMA이고 껍데기는 7z이라는 파일의 형태인 것이다. (이런 방식은 zip 등 다른 압축 파일 형식도 유사하다)

 

7-zip 공식 홈페이지를 방문해보자. (www.7-zip.org/)

여기를 자세히 보면 LZMA SDK는 있지만, 7z SDK는 보이지 않는다. NuGet 홈페이지에서 LZMA 패키지(www.nuget.org/packages/LZMA-SDK/)를 살펴봐도 똑같다. 즉, LZMA 라이브러리를 사용하면, '파일 하나의 내용'을 압축할 수 있지만, 딱 거기까지이다. 7z 파일을 만들어 주는 기능이 아닌 것이다.  혹시나 싶어 *. lzma라는 파일 포맷이 따로 있는지 살펴보니 있긴 있는데, 원본 파일의 내용을 압축한 이후에 저장 시에는 파일 헤더에 뭔가를 붙여 넣어야 한다. 자세한 내용은 링크 참고 => svn.python.org/projects/external/xz-5.0.3/doc/lzma-file-format.txt

이런 *.lzma 파일 포맷을 사용하겠다면 헤더를 직접 만들어서 넣어 줘야 하기 때문에 귀찮다. 다행히 *. lzma라는 포맷을 반디집 등에서 압축해제를 지원해주기는 한다. 하지만, 대중화된 포맷이 아니라서 부담스럽다.

 

막상 찾아보니 그리 어렵지는 않다. 아래 코드 참고 바람.

void CompressFile(string outFile, string inFile)
{
	SevenZip.Compression.LZMA.Encoder coder = new SevenZip.Compression.LZMA.Encoder();
	FileStream input = new FileStream(inFile, FileMode.Open);
	FileStream output = new FileStream(outFile, FileMode.Create);

	// Write the encoder properties
	coder.WriteCoderProperties(output);

	// Write the decompressed file size.
	output.Write(BitConverter.GetBytes(input.Length), 0, 8);

	// Encode the file.
	coder.Code(input, output, input.Length, -1, null);
	output.Flush();
	output.Close();
}

void DecompressFile(string inFile, string outFile)
{
	SevenZip.Compression.LZMA.Decoder coder = new SevenZip.Compression.LZMA.Decoder();
	FileStream input = new FileStream(inFile, FileMode.Open);
	FileStream output = new FileStream(outFile, FileMode.Create);

	// Read the decoder properties
	byte[] properties = new byte[5];
	input.Read(properties, 0, 5);

	// Read in the decompress file size.
	byte[] fileLengthBytes = new byte[8];
	input.Read(fileLengthBytes, 0, 8);
	long fileLength = BitConverter.ToInt64(fileLengthBytes, 0);

	coder.SetDecoderProperties(properties);
	coder.Code(input, output, input.Length, fileLength, null);
	output.Flush();
	output.Close();
}

 

그럼, 7z.dll을 로딩해서 사용하는 방법은 어떨까? NuGet을 검색해보면 SevenZipSharp라는 패키지를 발견할 수 있다. 

www.nuget.org/packages/SevenZipSharp

사용 방법은 간단해 보이지만, 파일이 깨진다는 댓글도 있고, DLL 로딩하느라 그런지 느리다는 얘기도 있다. 게다가 유지보수 안 한 지 꽤 오래되어 보인다. 즉, 프로젝트가 중단되었다는 얘기이다. 게다가 이 패키지는 비주얼 스튜디오 내부의 NuGet 브라우저에서 검색도 안된다. NuGet 홈에서 수동으로 다운로드하여야 한다.

 

NuGet에서 다시 검색해 보면, 의외로 가장 인기 있는 패키지는 따로 있다.

www.nuget.org/packages/SharpCompress/ 

SharpCompress 라고 하는 패키지인데, 7z, zip, rar 등 다양한 포맷을 지원하는 걸로 보이고, 다운로드 수도 어마어마하다. 단, 이 패키지는 .Net Standard 2.0 / .Net 5.0 이상만 지원한다. 즉, 예전 윈도에서는 호환성 문제가 있다.

 

마지막으로 살펴 볼 방법은 스택오버플로우 질문 글에서 채택한 답변인데, 아주 간단하다.

그냥 7z.exe를 프로세스로 실행하는 방법이다. 너무 간단해서 허무할 수도 있는데, 그래서 NuGet을 아무리 뒤져 봐도 내가 원하는 심플한 라이브러리를 못 찾은 게 아닌가 싶다.

 

7z.exe를 사용해서 파일 하나를 압축하는 방법을 간단히 c# 콘솔 버전 코드로 작성하자면 이렇다.

        static bool Compress(string output, string input)
        {
            try
            {
                ProcessStartInfo info = new ProcessStartInfo();
                info.FileName = "7za.exe";
                info.Arguments = "a -t7z \"" + output + "\" \"" + input;

                info.WindowStyle = ProcessWindowStyle.Hidden;
                Process P = Process.Start(info);
                P.WaitForExit();

                int result = P.ExitCode;
                if (result != 0)
                {
                    Console.WriteLine("error!! code = " + result);
                    return false;
                }

                return true;
            }
            catch (Exception e)
            {
                Console.WriteLine(e.Message);
                return false;
            }
        }

        static void Main(string[] args)
        {
            if (Compress("d:\\dummy.7z", "d:\\dummy.txt"))
            {
                Console.WriteLine("Success.");
            }
            else
            {
                Console.WriteLine("Failed.");
            }

            Console.ReadKey();
        }

그런데, 본인이 작성한 코드를 자세히 보면 실행파일 이름이 7z.exe가 아니라 7za.exe이다.

 

7za는 NuGet에서 7z으로 검색하면 최상단에 뜨는 공식 패키지에서 설치할 수 있다.

링크 : www.nuget.org/packages/7-Zip.CommandLine/

일반적인 패키지와 달리 클래스 라이브러리는 없고, 저 7za.exe만 실행파일 위치에 복사해서 넣어주는 좀 이상한 패키지이다.

 

7za.exe와 7z.exe는 어떻게 다를까?

 

일단 7-zip 어플을 공식 홈페이지에서 다운로드하여서 설치하면, c:\Program Files\7-zip 혹은 c:\Program Files (x86)\7-Zip\ 폴더에 설치되는데, 거기에 있는 readme.txt를 먼저 읽어 보자.

 

7zFM.exe - 7-Zip File Manager - 압축파일을 다양한 방식으로 다룰 수 있는 UI 툴이다.
7-zip.dll - Plugin for Windows Shell - 탐색기 콘텍스트 메뉴에서 7z을 사용할 수 있게 해주는 dll
7-zip32.dll - Plugin for Windows Shell (32-bit plugin for 64-bit system) - 이건 64비트 윈도용 32비트 버전
7zg.exe - GUI module - 콘솔 버전처럼 사용하는 툴이지만 결과가 팝업 UI로 표시되는 툴
7z.exe - Command line version - 콘솔 버전이다! 개발자에게 필요한 건 이것!
7z.dll - 7-Zip engine module - 7z.exe에서는 사용하는 dll.
7z.sfx - SFX module (Windows version) - 셀프 압축 해제용 실행파일을 만들 때 필요한 모듈 (윈도용)
7zCon.sfx - SFX module (Console version) - 셀프 압축 해제용 실행파일을 만들 때 필요한 모듈 (콘솔용)

 

즉, 위의 내용을 보면 7z.exe 와 7z.dll 최소 두 개의 파일을 내가 개발한 어플에 같이 포함해서 배포해야 한다는 얘기가 된다. 용량은 1.3MB 정도로 얼마 되지는 않는다. 7z.exe가 dll을 따로 분리한 것은 추후 다른 포맷을 쉽게 추가하기 위한 구조로 보면 된다.

 

반면, 7za.exe 확장성은 없지만, 독립(stand alone) 실행이 가능한 버전이다. 7z.exe와 dll을 합쳐 놓은 거라 보면 되고, 용량은 절반 정도로 훨씬 가볍다. 그래도 여전히 다양한 포맷(7z, lzma, zip, 7z, lzma, cab, zip, gzip, bzip2, Z, tar)을 지원한다.

 

그 외에 7zr이라는 것도 있다. 7z 포맷만 필요한 경우에 사용하면 되는 더 가벼운 버전이지만, 리눅스 버전 등은 있지만 윈도용 바이너리는 따로 배포하는 거 같지는 않다. 7-zip 소스 코드를 보니 프로젝트 파일이 존재하기는 한다. 7zr이 꼭 필요하다면 소스를 컴파일해서 만들어서 써야 할 것으로 보인다.

 

길게 설명했지만, 결론은 7za.exe 파일 하나만 첨부하면 된다는 뜻.

 

그리고, NuGet에서 배포 중인 7za의 버전은 현재 16.04 버전이다. 더 최신 버전인 19.00을 다운로드하고 싶다면, 공식 홈페이지에서 다운로드하면 된다.

다운로드 링크 : www.7-zip.org/download.html

 

마지막 고민은 7za를 쓸 것인가 아니면 LZMA를 직접 사용할 것인가이다. 현재 진행 중인 프로젝트에서는 용량은 크지 않지만, 많은 파일을 압축 해제해야 하기 때문에 성능도 중요하다. 7za를 사용하면 호환성이 좋고 코드는 심플해지지만 매번 프로세스를 호출해야 하는 부담이 있다. 반면, LZMA 라이브러리를 사용하면 이미 메모리에 적재된 함수를 사용하는 거라서 아무래도 성능이 더 좋지 않을까 하는 생각이 든다. 다만 이렇게 하면 파일 포맷은 *.7z이 아닌 *.lzma나 혹은 아예 나만의 커스텀 포맷을 써야 한다는 부담이 있다.

 

추가 내용

 

c#용으로 나온 LZMA SDK를 실제로 사용해 보니, 압축속도는 7z.exe를 이용하는 것보다 2배 정도 느렸지만, 압축해제를 할 때는 2배 정도 빨랐다. c++ 코드를 그대로 c#으로 포팅한 것이다 보니 성능은 좀 애매하게 나오는 걸로 보인다.

 

또, 예전 라이브러리 같아서 사용하지 않으려고 했던 SevenZipSharp를 다시 찾아보니, 다른 이름으로 바뀌어서 명맥을 유지하고 있었다. www.nuget.org/packages/Squid-Box.SevenZipSharp/ 이 라이브러리로 테스트를 해보니 7z.exe를 직접 실행하는 것보다 압축과 해제 통틀어 1.4~2배 정도 빨랐다. 아무래도 이걸 써야겠다. 역시 구관이 명관인가 보다.

+ Recent posts