Offline
Hub 离线
用户通常会仅通过Hub指示灯判断Hub当前的状态,这是错误的。Hub 固件< 2.0 ,接口调用失败,Hub指示灯同样会红色闪烁
为了避免用户错误的判断Hub当前的工作状态,我们建议用户结合App Hub设置页面有无IP 配置信息以及Hub 指示灯展示的颜色状态(紫色指示灯呼吸闪烁)来进行综合判断。
如果用户收到Hub离线通知,则不需要上述判断
排查步骤
-
通过influxdb、Hub shadow、pinglog 综合判断Hub当前是否处于在线状态
-
influxdb:查看Hub MQTT 连接情况,离线表现为Hub MQTT断开连接
-
Hub shadow:比较"connectedInfo"、"disconnectedInfo"两个属性中的 "versionNumber",如果"connectedInfo"中该值大于"disconnectedInfo"中的该值,则Hub在线;如果值一样,则判断两个属性中的时间戳哪个更接近当前时间,"connectedInfo"更接近,则Hub在线。
-
pinglog: 检查Hub ping接口调用情况
-
-
Hub如果离线,则需要根据influxdb以及pinglog和App操作日志查看的Hub工作状态进一步判断Hub离线问题类型。
-
检查Hub固件版本、型号、网络信息(包括配网方式等)
问题表现1
Hub突然离线,Pinglog突然中断,或没有任何有效信息,用户App没有任何操作
回复模板
您好,
针对您目前遇到的问题,我们注意到您您的Hub此次离线发生的十分突然。我们建议您首先检查Hub当前指示灯颜色状态,并根据不同的状态采取不同的方案恢复Hub上线。
为了避免您错误的判断Hub当前的工作状态,我们建议您结合MOCREO客户端,Hub设置页面有无IP 配置信息以及Hub 指示灯展示的颜色状态(紫色指示灯呼吸闪烁)来进行综合判断。
a.Hub红色指示灯闪烁
如果Hub当前指示灯展示为红色,那么我们判断这可能与Hub连接Wi-Fi失败或Hub与MOCREO Cloud Server通信不稳定有关。我们建议您可以通过*MOCREO Sensor* App重新添加的方式,恢复Hub上线。
如果网络状况有异常,那么可能会导致您的Hub Setup失败,不过您无需担心,您可以再次联系我们,我们会根据日志进一步排查分析您遇到的问题。
b.Hub蓝色指示灯闪烁(hub固件版本<v2.0,删除该段落)
Hub蓝色指示灯持续闪烁,则表示Hub当前处于Setup模式,Hub只有在首次Setup以及后续部署网络环境配置信息(例如SSID以及password)发生改变时或者Hub出现离线问题时需要重新Setup。
如果Hub当前处于正常工作状态,进入Setup模式会导致Hub无法联网,进而无法与MOCREO Cloud Server建立正常通信,从而导致Hub离线。
但是您无需担心,您只需要通过断电重启的方式,即可使Hub退出Setup模式,并恢复Hub上线。
c.Hub指示灯熄灭
如果Hub当前已经插入供电电源,但是Hub指示灯仍然无法正常亮起,我们建议您优先检查Hub供电电源是否稳定。
问题表现2
Hub维护性重启失败
问题分析以及解决方案
检查Hub配网方式,Wi-Fi还是以太网
-
Wi-Fi:Hub维护性重启过程中,连接Wi-Fi AP失败导致Hub离线。升级Hub固件版本至v2.0及以上版本,可以在Hub连接Wi-Fi AP失败时,强制Hub重启,解决Hub连接Wi-Fi AP失败而导致的离线问题
-
以太网:原因不明,需要查看Hub离线日志,进一步排查分析用户问题
回复模板1(Hub Wi-Fi 连接)
您好,
针对您遇到的问题,我们通过排查发现您的Hub近期确实存在频繁离线的问题,并且您的Hub每次离线都发生在维护性重启过程中,在目前最新版本的Hub固件中,已经针对性的处理了这个问题。
我们已经远程为您的Hub推送了最新的固件,您可以在不进行任何干预的情况下,观察Hub后续是否可以保持稳定工作。如果仍然无法稳定工作,请您再联系我们。
给您在产品使用上造成的不便,我们感到十分抱歉。
回复模板2(Hub 以太网 连接)
您好,
针对您遇到的问题,由于我们目前掌握的信息有限,如果您可以在Hub离线期间进入Hub Web Portal
详细操作步骤:
1.进入Hub Web Portal,并按照下述链接中的指导步骤导出Hub离线期间的日志
https://near-vole-576.notion.site/Detailed-process-on-how-to-access-Hub-Portal-and-export-logs-89db05a25dc74266ba1032575ce3c555?pvs=4
2.重启您的Hub,并再次导出Hub重启后恢复上线的日志
我们会根据您提供的2段Hub重启前后的日志进一步排查分析您遇到的问题。
期待您的再次反馈
问题表现3
Hub频繁维护性重启,即Hub接口调用频繁失败
问题分析以及解决方案
Hub pinglog Sequence Number 频繁出现 1000
- 如果Hub Pinglog Sequence Number 基本都是 1000,优先考虑用户侧网络存在限制部分端口的防火墙策略(尤其是 UDP NTP 超时)
- 如果只有在某个时段,Hub Pinglog Sequence Number 偶尔多次出现 1000 ,并且Hub尽管离线但是可以自行恢复上线,并且上线后可以稳定工作一段时间的优先考虑用户侧网络波动
回复模板1
您好,
针对您遇到的问题,我们通过排查发现您的Hub近期存在频繁离线的问题。
根据目前我们掌握的信息,我们判断这可能是由于Hub部署网络环境存在限制部分端口的防火墙策略导致,您可以访问下述链接,了解Hub访问外部服务(出站)所需要配置的防火墙策略。
https://mocreo.com/doc/manual/support/generaltopics/firewall-configuration-for-devices-linking-with-cloud.html
同时需要向您确认您现场是否具备其它网络环境可供Hub连接,如果有您也可以通过MOCREO SensorApp 重新添加该设备,并在添加时选择其他的网络进行连接,观察Hub是否可以顺利完成Setup流程,并且后续是否可以保持稳定工作。
回复模板2
您好,
针对您遇到的问题,我们通过排查发现您的Hub近期存在频繁离线的问题。
根据目前我们掌握的信息,我们判断这可能是由于Hub部署网络环境存在短暂波动导致...
检查用户Hub固件版本,如果版本较低可以升级Hub固件/如果固件版本为v1.9.8,那么可以回复后续持续观察一段时间
如果您在产品使用上有任何其它问题,请随时与我们联系
问题表现4
Hub Pinglog 没有问题,但是MQTT频繁断开连接
问题分析以及解决方案
- DNS解析失败,Hub v2.0 如果MQTT断开连接,会替换使用备用MQTT Host。可以优先升级Hub 固件至v2.0。查看问题是否能解决
主域名:d00182382sdytmlnz4l3s-ats.iot.us-west-2.amazonaws.com 备用域名:a1zjlbcv9qbzin-ats.iot.us-west-2.amazonaws.com
重启路由器也可以解决部分DNS解析失败的问题
- Hub在使用 AWS IoT 提供的 MQTT 服务时,解析服务域名得到多个IP地址,但Hub无法访问所有这些 IP 地址,导致 MQTT 连接不稳定
回复模板1
您好,
针对您遇到的问题,我们通过排查发现造成您的Hub频繁离线的原因可能与DNS解析失败有关。
我们为您提供以下解决方案,帮助您排查解决您遇到的问题:
1.我们为你的Hub远程推送了最新的固件,这将在一定程度上避免这一问题的出现,并且进一步优化您的Hub工作性能 2.如果方便的话,请重启您的路由器,这对于解决这一问题同样有一定的帮助
您可以在重启完路由器后,持续观察Hub后续工作情况,如果您的Hub仍然存在频繁离线的问题,请您再联系我们。
回复模板2
您好,
针对您遇到的问题,我们一直在关注您的Hub运行状况,并且已经将获取到的Hub日志反馈到MOCREO研发技术团队,通过和研发人员讨论,以下是我们爱查得到的结果:
1.Hub在使用 AWS IoT 提供的 MQTT 服务时,解析服务域名得到多个IP地址,但Hub无法访问所有这些 IP 地址,导致 MQTT 连接不稳定。 2.进一步检查发现,日志中无法连接的 IP 地址实际上是可访问的,这表明问题可能出在Hub部署的网络环境中,存在某些限制导致无法正常访问这些 IP 地址。
排查方法:
1.如果Hub部署现场有与HUb部署在同一网络环境下的电脑,以Windows为例,您可以在该主机通过打开命令提示符,使用 nslookup 命令,解析下述域名。并根据解析得到的IP地址,联系网络管理人员检查,当前网络环境是否有限制这些IP的防火墙策略或配置
(macOS也可以进入终端窗口,输入该命令进行解析)
主域名:d00182382sdytmlnz4l3s-ats.iot.us-west-2.amazonaws.com
备用域名:a1zjlbcv9qbzin-ats.iot.us-west-2.amazonaws.com
您需要确保解析后的IP地址集中的每一个IP地址都可以正常访问,没有任何限制才可以确保Hub后续不再出现频繁离线的问题。
问题表现5
H5/NS1 COAP订阅频繁失败,DNS解析失败,NTP获取时间失败
回复模板1
您好,
针对您遇到的问题,我们为您的H5-Lite(xxxx)创建了工作日志,并持续跟踪了一段时间。
我们发现您的H5-Lite与MOCREO Cloud Server通信十分不稳定,连接存在频繁中断的情况。我们判断这是导致您的H5-Lite频繁离线的原因。
在日志中,H5-Lite与服务器通信失败期间与同样无法访问第三方NTP服务器
所以我们判断造成您的H5-Lite频繁离线的原因与网络波动、防火墙或路由器策略限制UDP流量等因素有关
我们建议您首先进行以下检查:
Step 1.进一步检查Hub频繁离线问题与Hub自身有关还是与Hub连接的网络有关
A.首先在Hub频繁离线期间,通过H5-Lite自带的网络诊断功能,检查Hub局域网以及与MOCREO Server的通信情况,您同样可以将网络诊断的信息提供给我们,这对我们同样很有帮助。
Path: H5-Lite 右侧屏幕,Settings >>> Network & Internet >>> Network Diagnostics
B.同时使用与Hub连接相同网络的设备测试部分外部资源的连通性
通过:ping -t pool.ntp.org和ping -t coap.mocreo.com,这一指令(在Linux/macOS需要使用 ping -c pool.ntp.org),在Hub频繁离线期间使用与Hub连接相同网络的设备持续测试与第三方NTP服务器
如果A和B的结果一致,那么则说明这与网络有关而与设备自身无关,之后您可以按照下述Step 2和3的排查内容进一步检查网络侧可能存在的问题
Step 2.路由器防火墙检查
登录路由器管理页面,检查端口转发和防火墙规则:
找到「安全设置」→「防火墙」或「端口转发」。
确认是否放行目标地址:coap.mocreo.com:5684 / pool.ntp.org:123的出站流量。
Step 3.排查DNS解析稳定性
使用公共DNS测试解析结果
nslookup coap.mocreo.com 8.8.8.8 # Google DNS nslookup coap.mocreo.com 1.1.1.1 # Cloudflare DNS
正确的得到的IP Address应该是: 3.18.86.112
然后可以通过直接使用IP地址测试:ping -t 3.18.86.112
若Hub频繁离线期间,IP直连稳定,问题可能出在DNS解析环节。
Step 4.联系ISP
您也可以联系您的ISP,将目前的情况反馈给他们,明确是否有网络中断或维护的情况。
希望我的回答可以帮助到您
您可以将您的排查结果告知我们,以便我们进一步排查分析您遇到的问题
此外,如果您有任何其它诉求也可以与我们沟通。
祝您有美好的一天