肉鸡养殖业是我国畜牧业的主要组成部分,也是我国农业和农村经济的支柱产业之一[1],因此,肉鸡的健康状况监控就尤为重要。随着肉鸡养殖集约化、规模化的迅猛发展,改善肉鸡健康福利问题日益引起人们的重视[2]。在众多与肉鸡健康有关的动物行为中,采食行为是判断其生长状态以及健康状况的重要依据[3],采食量是其健康和生长状况的直观反映,因此准确获取采食量信息对肉鸡养殖有重要意义[4]。然而目前肉鸡采食量数据主要是人工测定的群体采食量,人力负担重且不能准确反映个体动物的采食和健康状况,因此自动准确地测定肉鸡采食量,能够在一定程度上降低人力损耗,监控肉鸡健康状况,提升肉鸡福利。
近年来,随着数字声音分析技术的发展,农场动物声音的分析研究越来越引起学者们的关注[5-7]。国内外学者就音频技术在禽畜养殖领域的应用进行了广泛研究,一部分学者利用音频技术在检测禽畜采食量方面做了一些探索,如利用声音识别测定反刍动物采食量[8-11]。该技术通过采集牛、羊等动物在进食时的音频数据,分析咀嚼、吞咽和反刍等声音在时域和频域上的特征如短时能量、梅尔倒谱系数和语谱图等进行相应行为的分类识别,从而确定咀嚼、吞咽和反刍的频率及次数,构建基于音频分析的采食量模型并获得最终的采食量。还有一部分国外学者在其他动物上做出了一些探索,如Aydin等[7]通过试验验证了肉鸡啄食次数与采食量呈高度线性相关,因此通过检测肉鸡进食时的啄食声音测定进食量是可行的。
本研究旨在利用音频技术检测肉鸡进食时的啄食次数,同时经试验分析确定啄食次数与采食量的关系模型,探索高效、精准的肉鸡采食量检测方法。
1 材料与方法 1.1 试验动物与音频采集装置选择10只40日龄的黄羽雄性肉鸡于滁州温氏畜牧有限公司下属的全椒肉鸡养殖中心进行试验。针对每只试验肉鸡建立如图1所示的采食声音获取装置,主体是1个规格为55 cm×40 cm×45 cm的笼子,在笼子靠近喂食器一侧装有型号为DS–2CD3135F–I的2.8 mm海康威视网络摄像机,镜头从侧面指向喂食器,录制肉鸡进食视频以人工标定啄食次数。视频以每秒25帧的采样率,2 048×1 536的图像尺寸录制,录制期间光线保持恒定,约9 klx。录音笔安装在喂食槽外侧,型号为爱国者R5530,麦克风灵敏度为–36~ –49 dB,所有声音以16位、48 kHz采样率进行记录。为记录每次试验肉鸡采食量,电子天平置于喂食器下方对喂食器进行实时称质量,型号为JM–B3,最大量程3 kg,精度0.01 g。
|
图 1 肉鸡采食音频采集装置 Figure 1 Audio acquisition device for broiler feeding |
每只试验肉鸡在同一天中不同时间段分别进行3次采食音频、视频采集试验,共进行30次试验,每次持续20 min。在试验开始之前,每只肉鸡中断供给食物和水4 h,以便在试验时促进采食行为,采用的饲料为谷物混合颗粒饲料。试验时分别通过摄像机和录音笔录制肉鸡采食视频和音频,并记录肉鸡每分钟采食量和总采食量。
1.3 声音信号预处理采集到的肉鸡啄食声音包含大量的无用信息与干扰数据,需经过预处理将其剔除,以提取出有效声音信息。
1.3.1 分帧加窗声音信号是十分复杂的非平稳信号,一般认为10~30 ms内声音信号特性基本不变或者变化缓慢[12],因此以帧长为10~30 ms对声音信号进行分帧处理。为了帧与帧之间平滑过渡,以前一般采用交叠分帧的方法分帧,现在为了减少边缘不连续和频谱泄露,通常使用汉明窗进行分帧[13]。其表达式[12]如下:
| $w\left( n \right) = \left\{ {\begin{array}{*{20}{l}}{0.54 - 0.46\cos \left( {\displaystyle\frac{{2\pi n}}{{N - 1}}} \right),}&{0 \leqslant n \leqslant N - 1}\;,\\{0,}&{\text{其他}}\;{\text{。}}\end{array}} \right.$ | (1) |
端点检测可以准确定位一段声音信号中有效信号的起点和终点,将采集到的啄食声音数据中大量的干扰信号排除,剪除静音片段,缩短后续信号处理时间,提高算法效率[14]。
现在端点检测大多在短时能量和短时过零率这2个声音信号典型特征的基础上进行分析,本文采用基于短时能量双门限算法实现啄食声音的端点检测。设声音样本经分帧处理后的第i帧xi(n),其短时能量Ei计算公式为:
| ${E_i} = \mathop \sum \limits_{n = 1}^L x_i^2\left( n \right),1\leqslant n \leqslant N,$ | (2) |
式中,L为帧长;n为声音样本第n帧;N为总帧数。
1.3.3 基于短时能量端点检测谱减法去噪为了将检测到的有效信号中的干扰噪声去除,便于后续特征提取及分类识别,需要对其进行去噪处理。在众多音频增强算法中,谱减法算法简单,运算量少,是目前常用的方法之一。本文将基于短时能量的端点检测法运用到谱减法中,对传统谱减法进行了一定程度的改进。因为之后的声音特征提取部分选择的是功率谱密度这一特征,因此本文使用功率谱谱减法。谱减法的基本原理[15]如下:
| $y\left( i \right) = x\left( i \right) + n\left( i \right),$ | (3) |
式中,y(i)为带噪音声音;x(i)为纯净声音;n(i)为噪声。对其进行傅里叶变换后得到的频域表示为:
| ${Y_\omega } = {X_\omega } + {N_\omega },$ | (4) |
式中,
| ${\left| {{Y_\omega }} \right|^2} = {\left| {{X_\omega }} \right|^2} + {\left| {{N_\omega }} \right|^2} + {X_\omega }{N_\omega }^* + {N_\omega }{X_\omega }^*,$ | (5) |
式中,
| $E\left[ {{{\left| {{Y_\omega }} \right|}^2}} \right] = E\left[ {{{\left| {{X_\omega }} \right|}^2}} \right] + E\left[ {{{\left| {{N_\omega }} \right|}^2}} \right]\;,$ | (6) |
根据声音信号在1个分帧内的短时平稳特性,有:
| ${\left| {{Y_\omega }} \right|^2} = {\left| {{X_\omega }} \right|^2} + {\lambda _k}\left( \omega \right),$ | (7) |
式中,λk(ω)为噪声信号|Nω|2的统计平均值,因此可近似得出原始声音数据:
| $\left| {{{\tilde X}_\omega }} \right| = {\left[ {{{\left| {{Y_\omega }} \right|}^2} - E\left( {{{\left| {{N_\omega }} \right|}^2}} \right)} \right]^{\frac{1}{2}}} = {\left[ {{{\left| {{Y_\omega }} \right|}^2} - {\lambda _k}\left( \omega \right)} \right]^{\frac{1}{2}}},$ | (8) |
式中,
从谱减法的原理可以发现对噪声谱的估计直接影响最终的去噪效果[16],因此本文采用基于短时能量的端点检测法和更为精确地估计噪声谱的谱减法进行去噪处理。运用“1.3.2”端点检测方法检测有无有效声音存在,有则减去噪声,估计得到谱减后的声音信号;若无,则用这段无有效声音噪声段重新估计噪声更新噪声谱,等检测到新的有效声音信号后,利用更新后的噪声谱进行谱减操作。
1.4 声音信号特征提取声音信号的功率谱密度(Power spectral density,PSD)反映了信号能量特征随频率变化的规律,可以较好地反映不同类型声音数据的频域特征[17],不少学者将其作为利用频域分析法识别声音时所依据的信号特征[18-19]。假设1个采样频率为fs的声音样本其第m帧信号为x(n),n∈[0,N-1],则采样点为N的帧信号的离散傅里叶变换[12]为:
| ${X_k} = \mathop \sum \limits_{n = 0}^{N - 1} x\left( n \right){{\rm e}^{ - j\frac{{2\pi nk}}{N}}},k = 0,1, \cdots ,N - 1,$ | (9) |
式中,Xk为声音信号x(n)经离散傅里叶变换后的频域数据;j为虚数单位。把第m帧声音信号在不同频率范围内的功率(Wm)定义为:
| ${W_m} = \mathop \sum \limits_{i = {f_b}}^{{f_e}} {P_i}{f_r},$ | (10) |
式中,fb为起始频率;fe为终止频率;fr为频率分辨率;Pi为频率i处的功率谱密度。
1.5 声音识别对“1.3.2”端点检测方法检测出的有效声音辨别后发现,非啄食声音虽然大部分为鸡鸣声,但剩下的其他声音仍多种多样,所以如果采用多分类的方法对检测到的声音分类识别,将会耗费巨大的成本去收集每种负样本。由于鸡场实际生产养殖环境复杂,无法预计会出现哪种干扰噪声导致无法收集到所有负样本,因此为了应对研究中出现的正负样本数目失衡的情况,本文将啄食声音检测转变成1个特殊的二分类问题,也就是将声音分为啄食声音和非啄食声音。为此本文提出1种基于单分类支持向量机(One-class support vector machine,OC-SVM)的肉鸡啄食声音分类识别算法。
OC-SVM最早由Schölkopf等[20]提出并构建,基本原理是在特征空间中找1个超平面实现目标样本与原点的最大分离,此时原点被设为唯一的非目标样本。设有目标样本S={xi, i=1, 2,…, N},本文中为肉鸡啄食声音,通过非线性映射函数Φ将样本数据映射到高维特征空间,最优超平面与坐标原点的最大距离为
| $\left\{ {\begin{array}{*{20}{l}}{\min\displaystyle\frac{1}{2}{{\left| {\left| \lambda \right|} \right|}^2} + \displaystyle\frac{1}{{vN}}\mathop \sum \limits_{i = 1}^N {\xi _i},\;\; v \in \left( {0,1} \right)}\\{s.t.\left[ {\lambda \Phi \left( {{x_i}} \right)} \right] \geqslant \rho - {\xi _i},\;\; {\xi _i} \geqslant 0}\end{array}} \right.,$ | (11) |
式中,N为目标样本的数量;v为平衡参数,用以控制支持向量在目标样本中所占比例;ξ为目标函数的惩罚系数。因此决策函数为:
| $f\left( x \right) = sgn\left[ {\lambda \varphi \left( x \right) - \rho } \right]{\text{。}}$ | (12) |
此时再引入拉格朗日乘子,将上述问题转变为对偶问题:
| $\left\{ {\begin{array}{*{20}{l}}{\mathop {\min }\limits_\alpha \displaystyle\frac{1}{2}\mathop \sum \limits_{i = 1}^N \mathop \sum \limits_{j = 1}^N {\alpha _i}{\alpha _j}K\left( {{x_i},{x_j}} \right)}\\{s.t.\;\;\;0 \leqslant {\alpha _i} \leqslant \displaystyle\frac{1}{{vN}}\;\;,\;\;\displaystyle\mathop \sum \limits_{i = 1}^N {\alpha _i}}=1\end{array}} \right.,$ | (13) |
式中,K(xi,xj)为核函数;αi、αj为拉格朗日乘数。求解上式可得最终决策函数:
| $f\left( x \right) = sgn\left( {\mathop \sum \limits_{i = 1}^N {\alpha _i}K\left( {{x_i},{x_j}} \right) - \rho } \right){\text{。}}$ | (14) |
对于待测样本而言,当f(x)>0时,则该样本为正样本即啄食声音,否则属于非啄食声音。
2 结果与分析 2.1 肉鸡啄食次数与采食量关系分析表1和图2是每只肉鸡3次采食试验的啄食次数和采食量数据,每次啄食采食量的最低平均值0.025 85 g出现在8号黄羽肉鸡的第1次试验中,最大平均值0.028 24 g出现在3号肉鸡第3次试验中。进一步对比分析每次试验累积啄食次数与累积采食量数据,图3是7号肉鸡第2次试验以分钟为时间单位的累积啄食次数与累积采食量对比分析图,很明显看出两者具有很强的线性关系。图2显示了每次试验啄食次数与采食量的线性拟合结果,R2=0.982 5,说明可以通过啄食次数获取采食量。
|
|
表 1 肉鸡啄食与采食量数据 Table 1 Data of broiler chicken pecking and feed intake |
|
图 2 肉鸡3次采食试验的采食量与啄食次数数据及分析结果 Figure 2 Data and analysis results of broiler chicken feed intake and pecking number in three feeding experiments |
分析结果如图4所示,图4a是肉鸡采食音频片段,与鸡场背景噪声相比,啄食声音近似于脉冲信号,短时能量通常偏大,利用基于短时能量的端点检测法就能有效提取出有用的声音片段。
对肉鸡采食音频进行端点检测,经人工辨别分类发现有一些非啄食声音也会被检测出来,其中有75%左右为肉鸡靠近录音笔时鸣叫的声音,因此非啄食声音中以鸡鸣声音为例和啄食声音做对比分析。图4b是肉鸡鸣叫和啄食声音低于24 kHz部分的声音频谱图,可以看出啄食声音频率主要集中在低于3 000 Hz部分,其中高能部分集中在660 Hz左右;鸣叫声音频率主要集中在1 400~4 800 Hz之间,高能部分集中在3 200 Hz左右。此外,由图4c可知,肉鸡啄食声音的功率谱密度在低于3 000 Hz部分曲线波动较大,高于3 000 Hz部分走势相对平缓;鸣叫声音的功率谱密度整体波动幅度都较大。通过对比看出,2种声音的功率谱密度特征有明显差异,因此选择功率谱密度作为声音识别特征在理论上是可行的。为了减少数据量,提高算法效率,选取较能代表啄食声音特征,且啄食和鸡鸣2种声音功率谱密度差异最为明显的0~3 500 Hz部分作为特征来精准识别是否为啄食声音。
|
图 3 7号肉鸡第2次试验累积采食量与啄食次数关系 Figure 3 Relationship between feed intake and pecking number of No.7 broiler chicken in the second feeding experiment |
从5号肉鸡其中1次试验中选取200个啄食声音的功率谱密度作为训练样本训练OC-SVM模型,之后利用基于音频技术的肉鸡啄食次数检测算法对剩余29次试验进行啄食次数检测,结果如图4d所示。啄食次数检测误差率最小为1.01%,最大为12.75%,出现在8号肉鸡第1次试验中,该肉鸡其余2次试验误差率分别为10.72%和8.67%,整体误差偏大。分析肉鸡采食音频端点检测效果和啄食频率,发现当啄食频率大于每秒20次时,端点检测会将间隔很短的2~3次啄食声音误提取成1次,从而引起误差。统计10只试验肉鸡的啄食频率,频率超过每秒20次的总啄食次数在500次左右,其中有大约200次出现在8号肉鸡采食试验中,导致该肉鸡啄食次数检测误差较大。在10只肉鸡的30次采食试验中发现,啄食频率过大只是个例现象,总出现概率为1.85%,不会对啄食次数检测准确率产生过大的影响。
2.3 基于音频的肉鸡采食量检测方法及可信度分析将“2.2”检测到的肉鸡啄食次数经“2.1”确定的啄食次数与采食量关系计算出每次试验的肉鸡采食量,结果如图5所示。采食量检测误差率最小值为2.42%,最大值为15.26%,出现在3号肉鸡的第3次试验中。分析发现,该次数据误差大的原因是此次试验肉鸡每次啄食平均采食量为0.028 224 g,较啄食次数与采食量线性关系中的斜率0.026 5(图2)偏差较多,因此在啄食次数误差率较小(2.49%)的情况下出现了偏大的误差。综合分析,基于音频的啄食次数计算正确率约为94.58%,由此获得的采食量计算整体正确率约为91.37%,说明基于音频的采食量检测方法是可行的。本文的端点检测算法还需进一步优化以提高精度,并解决个别肉鸡每次啄食平均采食量过大或过小的问题。
|
图 4 时域、频域、功率谱密度图及肉鸡啄食次数检测结果 Figure 4 Time domain, frequency domain, power spectral density picture and detection result of broiler chicken pecking number |
|
图 5 肉鸡采食量检测结果 Figure 5 Detection result of broiler chicken feed intake |
本研究提出了一种利用音频技术计算肉鸡采食量的方法,该方法主要基于肉鸡啄食次数与采食量的高度线性相关性。试验结果显示基于音频的啄食次数计算正确率为94.58%,采食量计算正确率为91.37%,表明该方法可用于肉鸡采食量测定。下一步将对不同日龄、不同品种以及不同饲料种类等情况下的肉鸡采食量计算模型进行研究,以进一步完善基于音频的肉鸡采食量测定方法。
| [1] |
辛翔飞, 刘春芳, 王济民. 我国肉鸡产业发展现状、问题与对策[J]. 中国家禽, 2011, 33(4): 6-9. ( 0) |
| [2] |
辛翔飞, 王济民. 我国肉鸡产业发展现状、影响因素及对策建议[J]. 中国家禽, 2014, 36(15): 2-5. DOI:10.3969/j.issn.1004-6364.2014.15.002 ( 0) |
| [3] |
汪开英, 赵晓洋, 何勇. 畜禽行为及生理信息的无损监测技术研究进展[J]. 农业工程学报, 2017, 33(20): 197-209. DOI:10.11975/j.issn.1002-6819.2017.20.025 ( 0) |
| [4] |
PÉREZ J F, ROURA E. Modulation of feed intake in pigs and chickens: Preface[J]. Anim Feed Sci Technol, 2017, 233: 1-2. DOI:10.1016/j.anifeedsci.2017.08.003 ( 0) |
| [5] |
SADEGHI M, BANAKAR A, KHAZAEE M, et al. An intelligent procedure for the detection and classification of chickens infected by clostridium perfringens based on their vocalization[J]. Rev Bras de Ciênc Avíc, 2015, 17(4): 537-544. DOI:10.1590/1516-635X1704537-544 ( 0) |
| [6] |
曹晏飞, 陈红茜, 滕光辉, 等. 基于功率谱密度的蛋鸡声音检测方法[J]. 农业机械学报, 2015, 46(2): 276-280. DOI:10.6041/j.issn.1000-1298.2015.02.040 ( 0) |
| [7] |
AYDIN A, BAHR C, VIAZZI S, et al. A novel method to automatically measure the feed intake of broiler chickens by sound technology[J]. Comput Electron Agric, 2014, 101: 17-23. DOI:10.1016/j.compag.2013.11.012 ( 0) |
| [8] |
姚意. 基于ANT的奶牛反刍信息采集系统研究[D]. 上海: 东华大学, 2015.
( 0) |
| [9] |
张中炜, 唐雅琴, 胡江浩, 等. 一种反刍动物反刍与吞咽次数的音频识别算法: CN201410097818.X[P]. 2017-02-15.
( 0) |
| [10] |
GALLI J R, CANGIANO C A, MILONE D H, et al. Acoustic monitoring of short-term ingestive behavior and intake in grazing sheep[J]. Livest Sci, 2011, 140(1/2/3): 32-41. ( 0) |
| [11] |
LACA E A, WALLISDEVRIES M F. Acoustic measurement of intake and grazing behaviour of cattle[J]. Grass Forage Sci, 2000, 55(2): 97-104. DOI:10.1046/j.1365-2494.2000.00203.x ( 0) |
| [12] |
赵力. 语音信号处理[M]. 北京: 机械工业出版社, 2009: 32-45.
( 0) |
| [13] |
HANCHATE D B, NALAWADE M, PAWAR M, et al. Vocal digit recognition using artificial neural network[C]//IEEE. 2010 2nd international conference on computer engineering and technology (ICCET). New York: IEEE, 2010: 88-91.
( 0) |
| [14] |
张振华. 基于音频分析技术的猪异常检测[D]. 太原: 太原理工大学, 2017.
( 0) |
| [15] |
LOIZOU P C. Speech enhancement: Theory and practice[M]. Boca Raton: Crc Press, 2007: 75-101.
( 0) |
| [16] |
高留洋, 朱文, 桑振夏, 等. 一种基于改进的谱减法的语音增强算法[J]. 现代电子技术, 2012, 35(17): 60-62. DOI:10.3969/j.issn.1004-373X.2012.17.019 ( 0) |
| [17] |
李博宇, 赵翠莲, 吴佳伟, 等. 噪声环境下的仔猪求食发声信号识别[J]. 电声技术, 2016, 40(7): 44-49. ( 0) |
| [18] |
MALLEKH R, LAGARDÈRE J P, ENEAU J P, et al. An acoustic detector of turbot feeding activity[J]. Aquaculture, 2003, 221(1/2/3/4): 481-489. ( 0) |
| [19] |
EXADAKTYLOS V, SILVA M, AERTS J M, et al. Real-time recognition of sick pig cough sounds[J]. Comput Electron Agric, 2008, 63(2): 207-214. DOI:10.1016/j.compag.2008.02.010 ( 0) |
| [20] |
SCHÖLKOPF B, PLATT J C, SHAWE-TAYLOR J, et al. Estimating the support of a high-dimensional distribution[J]. Neural Comput, 2001, 13(7): 1443-1471. DOI:10.1162/089976601750264965 ( 0) |
2018, Vol. 39



0)