Jak wyodrębnić tekst z obrazów przy użyciu wyrażeń regularnych

Udostępnij w sieciach społecznościowych:

To jest krótki samouczek do wyjaśnienia jak wyodrębnić tekst z obrazów przy użyciu wyrażeń regularnych. Imgregex to bezpłatne narzędzie online, w którym możesz przesłać zdjęcie i wyodrębnić z niego tekst do odczytu maszynowego, a następnie po prostu go grepować. Za pomocą grepowania można użyć wyrażeń regularnych do wyodrębnienia pasującego tekstu. Dzięki temu możesz łatwo wyodrębnić numery telefonów i e-maile z obrazu. Jednym z najlepszych przypadków użycia tego narzędzia jest ekstrakcja informacji kontaktowych z obrazów wizytówek. Istnieje również API do tego, ale na razie jest to praca w toku.

Istnieje wiele internetowych narzędzi OCR do wyodrębniania tekstu z różnych obrazów, ale nie oferują one opcji filtrowania wyodrębnionego tekstu. W tym celu musisz wykonać dodatkową pracę, aby uzyskać ostateczne dane. Ale tutaj nie musisz tego robić. Witryna Imgregex pobiera tylko obraz wejściowy wraz z wyrażeniem regularnym i daje wynik końcowy w formacie JSON. Możesz użyć dowolnego wyrażenia regularnego, aby z łatwością wyodrębnić tekst o dowolnym wzorze. Nie uważaj tego jednak za 100 procent dokładności dla każdego obrazu. Dokładność ekstrakcji tekstu zależy od stanu obrazu wejściowego.

Jak wyodrębnić tekst z obrazów przy użyciu wyrażeń regularnych

Jak wyodrębnić tekst z obrazów przy użyciu wyrażeń regularnych?

Na razie możesz korzystać z tej strony bez rejestracji. Po prostu uzyskujesz dostęp do głównej strony głównej tutaj, a następnie po prostu zaczynasz z niej korzystać. Tutaj wystarczy załadować lub przeciągnąć obraz wejściowy, z którego chcesz wyodrębnić tekst. Następnie musisz określić wyrażenie regularne, aby zdefiniować pasujący wzorzec do wyodrębnienia tekstu. Wyrażenia regularne są łatwe do nauczenia, ale wymagają praktyki, możesz nauczyć się RegEx na tej stronie.

imgregex prześlij obraz wejściowy

Po określeniu wyrażenia regularnego w celu wyodrębnienia tekstu na podstawie wzorca możesz po prostu nacisnąć przycisk „WYŚLIJ” i wyświetlić wynik w JSON. Dane wyjściowe są wyświetlane w prawym okienku, jak widać poniżej. W moim przypadku przesłałem wizytówkę i określiłem wyrażenie regularne wyciągu numeru telefonu z USA i tam wykonałem całkiem niezły wysięg.

Zobacz:   Jak usunąć tło obrazu za pomocą Paint 3D w systemie Windows 10?

Imgregex w akcji

W tym momencie już wiesz, o czym jest ta strona i jak działa. Dajesz mu tylko obraz wejściowy, aby wyodrębnić tekst wraz z wyrażeniem regularnym. Następnie możesz po prostu uzyskać wynik i robić, co chcesz. Wyniki JSON, które tworzy, można również konwertować na inne za pomocą formatów CSV przy użyciu niektórych konwerterów JSON na CSV.

Końcowe przemyślenia

Jeśli szukasz sposobu na wyodrębnienie tekstu z obrazu przez jego filtrowanie, to trafiłeś we właściwe miejsce. Skorzystaj ze strony, o której tu wspomniałem, a następnie po prostu rób, co chcesz. Daj mu czysty obraz dla wysokiej dokładności, a następnie uzyskaj wynik w ciągu kilku sekund. To takie proste.

Komentarze Facebook