 
	
				imvladikon/wav2vec2-xls-r-300m-lm-hebrew
		
			Automatic Speech Recognition
			โข 
	
				Updated
					
				
				โข 
					
					30
				
				โข 
					
					1
				
| audio
				 audioduration (s) 0.72 9.64 | sentence
				 stringlengths 5 74 | 
|---|---|
| ืืื ืืืื ื ืืืชื ืืืชืจ ืืื ืืื ืืืจ | |
| ืจืฆืืชื ืืืืื ืขืืฆืื ืืืฆืจ | |
| ืื ืกืืจื ืืืฉื ืฉืื ื ืขืืฉื ืขื ืืืื-ืืง ืืืฉืจืืื | |
| ืืื ืฉืื ืืืืช ืืื ืืื ืื ืืขืฉืืช ืืืง ืืืจื ืืื ืืกืืจ ืืจืืฉืื | |
| ืื ืืืืื ืืช ืืืืฃ ืืืื | |
| ืืืฉ ืืฉืื ืืืืฉืืง ืฉืื ื ืืชื ืื ืืจืื ืืืื | |
| ืืืจื ืฉืืืคื ืืช ืืฉืืื ืืืชืคื ื ืืขื ืืช ืขื ืื ืฉืืืื ืื ื ืฉืืื ืขืืื | |
| ืืืืื ืฉืืชืืืืื ื"ืืืชืง ืืื ืืืฉืจืื ืฉืงืจื ืืืืฉืื ืืฉืื ืืืืจ | |
| ืื ืืจืื ืืืืืกื ืืืืื ืื ืืื | |
| ืื ืืืืื ืื ืื ืข ืืื ืืฉืื ืืืจ ืืขืืื ืืื | |
| ืืช ืืงืก ืืืงืฉืืช ืืืืื ืืจืื ืืงื ืืฉืื | |
| ื ืื ืกืช ืืืขืืช ืื ืขืืช ืืช ืืืืช ืืืจืื | |
| ื ืืกืืช ืืืืจ ืืืื ืืืืจืชื ืืืชื | |
| ืืชืืื ื ืืขืฉืืช ืืกืืืืช ืืืชืจืชืืืช ืฉื ืืื ืืืจ ืืืื ืืืืืืช ืื ื ืืื ืฉื ืืืจ | |
| ืื ืื ื ืืฉืืื ืขืช ืืืืจื | |
| ืขื ืขืื ืืื ืื ืฉืื | |
| ืื ืฉืืืืฉื ืื | |
| ืชืจืื ืื ื ืืืื ืื ืืชืืื ืื ืืฉืื ืืืืช | |
| ืืืฉืืื ืืืืืืจ ืืื ืืื ื ืขืงืจืืื ื ืืฉืื | |
| ืฉืื ืกืื ืืืืช ืืื ืืืืคืืช ืืืืื ืืืชืจ ืืืืงื ืืจืขืืื ืืืฉืจ ืืืขืืื | |
| ืื ืื ื ืืจืืืื ืืช ืื ืื ืืืื ืืืชื ืคื | |
| ืื ืืขืืงืจ ืืื ืขื ืขืฆืื ืืืืืฉื ืืขืจื | |
| ืฉืืืืช ืืืืื ืืจืืืืืืช ืฉื ืืืื ืชืืคืช ืืื ืืชืขืืจืจืชื ืืืืืชื | |
| ืืืืืจื ืื ืืืืืืื ืืืื ืืืคืขื ืืขื ืง ืืื ืืืืืคืจืฆืื | |
| ืื ืืื ืื ืืชืืืื ืืื ืฉืืฉื ืืื ืงื | |
| ืืืจื ืฉืืืขืืื ืืืืช ืจืง ืขืืืืชื ืื ืงืืจื ืืืืช | |
| ืืืืื ืืืืจืื ืืจืืฉืื ื ืืฉืืื ืขื ืืืืื ื ืคืืืืื | |
| ืืื ืืฉืื ืื ืฉืื ืืจืื ืื ืืืืื ืืืื ืืฉืื ืื ืฉืื ืฉืื ืืงืจื | |
| ืืฉ ืืืื ืฉืืืื ืื ืืื ืืืช ืกืคืจ ืืฉืืืื  ืืืืืื ืื ืืื ื | |
| ืืืชืจ ืืคืืื | |
| ืืฆืขืืจืื ืืืืืื ืืงืฉื | |
| ืื ืื ื ืืืืืื ืื ืื ื ืืฉืจืืืื ืฉืืขืืื ืืืชื ื ืฉืืชื ื ืื ื ืืืืืช ืืฉืงื | |
| ืืืื ืืืื ืืืคื | |
| ืืื ืื ืืื ืื ื ืืื ืื ืืฉืืื | |
| ืืื ืืืืื ืืช ืืืืจื ืื ืคื ืืืืขืืื ืืืฉืชืืฉ ืืจืืืืื ืืื ืืคืชื ืืช ืืืืื ื | |
| ืืื ืื ื ืขืืืื ื ืฉืืจืช ืืืคืืืืืช ืฉืืืฆืื ืืื ืคืชืจืื | |
| ืืชื ืืืื ืืืืืช ืืคืกื ืื ืื ืคืฉืื ืืืืืช ืืืจืก ื ืืืจืืช | |
| ืืฉืจืื ืจืืืขืืช ืฉืืจืืืช ืฉื ืืืืื | |
| ืื ืืชื ืืฉืืงืื ืืื ืืืฉืื ืฉืืฉืืง ืืคืขื ืืจืืฉืื ื ืืื ืืืืจ ืืจืืงืื | |
| ืืื ืืฆืืช | |
| ืืืชื ืขืืฉื ืืช ืื ืืืชื ืืืฉืื ืืื ืืฉืื ืฉืืคืขืืื ืื ืื ื | |
| ืืื ืืช ืืจืื ื ืจืื ืฉืืื ืฉืจืฃ ืขื ื ืืกืื ืืจืืื ืืขืืื ืืขื ืืกืขืืช ืคืืจื ืืื | |
| ืืื ืืื ืืืชื ืื ืืืื ืืื ืืืง ืืื ื ืืื ืื ื ืืืื ืืืืื | |
| ืื ืฆื ืืื ืืืกืชืื ืขื ืื | |
| ืื ืื ืืื ืฆืจืื ืืืขืช ืฉืืืืช ืฉืื ืืืฆื ื ืืจืืื | |
| ืืื ืจืฆืื ื ืืืืชื ืืชืคืฉืจ ืืื ืืืืื ื ื"ืืืชืืจ ืืฉ ืื ืชืืื | |
| ืื ืขืื ืืืืืื ืืื ืื ืจืืืื ืืืช | |
| ืืืืข ืืืืงืช ืืื ืืกืืืืื ืืืืืื | |
| ืื ืื ื ืื ืจืืื ื ืืืื ืื ืืื ืื ืืืขื ืฉืืื ืืกืื ืช ืืืื | |
| ืื ืืื ืช ืฉืื ื ืื ืฉืืืืช ืืืืืจ ืืืืจื | |
| ืื ืขืืืจ ืขื ืืื ืื | |
| ืชืืื ืื ืืืืื ืฉืื ืืจืืฉืชื ืฉืืฉ ืืืง ืื ืืชืื | |
| ืืื ืืืืจื ืื ืืฉืื ืฉืื ื ืืืงืืช ืืืชื ืืืืื ืืืืฅ | |
| ืืืืช ืืื ืฉืื ื ืฉืืข ืื ืืื ืงืฉื ืืื ืืืืจ ืืื | |
| ืืืชื ืืืฉื ืื ืืื ืื ืืื | |
| ืื ืืืื ืื ืืืจืื | |
| ืจืืืชื ืฉืืืืจื ืืขืืจ ืฆืจืื ืืืฉืงืืข ืืจืื | |
| ืืืืืช ืืงืืืื ืืืืืืช ืฉืืฉืื ืื ืื ืืขืื | |
| ืื ืงืืจื ืกืืืื ืื ืืืื ืกืืื ืืืชืืืื | |
| ืกืืคืจ ื ืื | |
| ืื ืื ืืืฉื ืคื ืืื | |
| ืืช ืฆืจืืื ืืืงืฉ ืืช ืื ืืช ืฆืจืืื ืื ืื ืขืฉื ืื ืืขืืืช | |
| ืืื ืื ื ืืื ืชื ืืช ืื ืืคืขื ืืจืืฉืื ื | |
| ืืืฉืืจื ืื ืขืฆืจื ืืืชื | |
| ืื ืืืื ืืฃ ืคืขื ืื ืืืืชื ืฉืืื ืืืชืจ | |
| ืืื ืืืงืฉื ืืืืจ ืฉืืืื ืืืงืฉืื | |
| ืื ืืฉืืจืชื ืืื ืืืชื | |
| ืืฉ ืื ืืื ื ืืชืืืืช ืืืช ืื ืืืื ืฉืืขืืื | |
| ืืื ืืื ืืืจื ืื ืืขืืื ืืช ืฉืฆืจืื ืืืชืืื ืืืคืื ืคืกืืืืืืื | |
| ืืฉ ืื ืืื | |
| ืฉืคืฉืื ืื ืื ืฉืืืฉื ืืืืช ืงืคื ืืฉืืข ืืืชื ื | |
| ืื ืชืืชืื | |
| ืืื ืฉืื ืชืืคืื ืื ืื ืืช ื ืืคืืช ืืืช ืืงืืืช ืฉืืจ ืื ืืฉืื | |
| ืืช ืืืกืืก ืืช ืืืืจืื ืืช ืืืฉืคืื ืืช ืืงืืืื | |
| ืื ื ืื ืืืื ืืืืจืช ืืื ืฉืืืื | |
| ืืื ืืืื ืื ืื ื ืืืฉื ืฉืืืื ืืฉืื ืืืืื ืืช ืืืืื ืฉืืื ืื ืขืื ืื ืืื | |
| ืืื ืื ื ืืืืข ืืื ืกืคืื | |
| ืืชืื ืืืืจ ืืื ืฉื ืงืจื ืงืืจืงืื ื | |
| ืืืจืื ืืืจืื ืื ืืจืฆื ืืืจืื ืขื ืื | |
| ืืืืืื ืืกืคืจ ื ืืื ืฉื ื ืืืงืื | |
| ืืื ืืจืืฉืช ืฉืืื ืื ืืจืืจื | |
| ืืืงืื ืื ืืืขืชื ืขืืฉืื ืืชืื ืช ืืืืง ืคื ืืืืฃ ืฉืื | |
| ืฉืงืืืืชื ืคืฉืื ืืืืื ืืืฉืื ืื ืืืืืจ ืื | |
| ืื ืืืืจ ืืื ืืื ืืฉืื ืฉืื ืืืื ืืช ืืืื ื | |
| ืืืจื ืื ืืขืฆื ืกืื ืฉื ืืก ืืื ืืืชืจ ืืื | |
| ืฉืืื ืืืจืืื ืืืขืฆืจืื ืืขืื ืืืื ืืืืืฆืืืช ืืืืจื ืฉื ืืืคื ืืืจืืื | |
| ืืืืชื ืืืืช ืขื ืืืกื ืืืฉื | |
| ืืื ืืืื ืืืืืื ืืช ืืืืจื ืืคื ืืชืคืงืืืื | |
| ืื ืืืื ืขืืืจ ืืฉืืื ืืืฉืืืื ืืฉืื ืืื | |
| ืืจืืก ืืืืจืื ืืืื ืืืืืื ืืืืขืฉื ืืืกื ืืช ืื ืืืื ืืืืืืข ืืื | |
| ืืืืจืื ืื ืืืืื ืฉืื ืืืจืฉืข ืืขืืืจืืช ืืื | |
| ืืืง ืืืืืงืจืื ืืืงื ืกืคืฆืืคืืช ืืช ืืจืืืฉืื | |
| ืืืื ืืืืฆื | |
| ืืื ืืชืืื ืชื ืขื ืื ืืจืืฉ | |
| ืืืงืฉืชื ืืืจืืคืื ืฉืชืืื ืื ืืช ืืืืคืื ืืื ืฉืืขืื ืืฆืื ืื ืืช ืืืื ืืืชืจ ืืจืืจ | |
| ืืืืืื ืฉื ืืืืฉื ืืืืชื ืคืืืช ืืจืืื ืกืืืืชื ืืช ืืฆืื ืืื ืืืืชื ืคื | |
| ืืืืืื ืื ืื ืืืง ืืืืืืจืจ ืื | |
| ืืื ืืฉืื ืืชื ืืคื ืฉืื | |
| ืฉืืืืช ืืื ืื ืืืจ ืื ืืืขืื ืืื ืฉืฆืจืื | |
| ืืช ืืืืื ืืืกืชืื ืขื ืื ืืืืืื ืืคื ืื | 
Hebrew Dataset for ASR
[More Information Needed]
[More Information Needed]
{'audio': {'path': '/root/.cache/huggingface/datasets/downloads/extracted/8ce7402f6482c6053251d7f3000eec88668c994beb48b7ca7352e77ef810a0b6/train/e429593fede945c185897e378a5839f4198.wav',
  'array': array([-0.00265503, -0.0018158 , -0.00149536, ..., -0.00135803,
         -0.00231934, -0.00190735]),
  'sampling_rate': 16000},
 'sentence': 'ืืื ืืืื ื ืืืชื ืืืชืจ ืืื ืืื ืืืจ'}
[More Information Needed]
| train | validation | |
|---|---|---|
| number of samples | 8000 | 2000 | 
| hours | 6.92 | 1.73 | 
scraped data from youtube (channel ืืื) with removing outliers (by length and ratio between length of the audio and sentences)
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
@misc{imvladikon2022hebrew_speech_kan,
  author = {Gurevich, Vladimir},
  title = {Hebrew Speech Recognition Dataset: Kan},
  year = {2022},
  howpublished = \url{https://huggingface.co/datasets/imvladikon/hebrew_speech_kan},
}
[More Information Needed]